arXiv: исследователи ИИ предупредили о грядущем крахе моделей генерации контента

21.06.2023 Наука

Похожие статьи

307

Исследователи из Великобритании и Канады предупреждают, что широкая популярность технологии генеративного искусственного интеллекта может привести к опасным последствиям, пишет Хайтек+.

Чатботы, основанные на таких моделях, как ChatGPT, обучаются на огромных объемах данных, и многие ведущие компании активно используют такой генеративный ИИ. Проблема в том, что машинное обучение ИИ на сгенерированных данных может обрушить обученные модели, что может привести к неадекватному контенту и большему количеству ошибок.

«Мы обнаружили, что использование генерируемого моделью контента в обучении приведет к необратимым дефектам в будущих поколениях моделей», — заявили ученые.

Коллапс модели происходит, когда ИИ получает все больше и больше данных, сгенерированных самим ИИ. Постепенно модель становится менее эффективной, а ее ответы теряют вариативность. Исследователи считают, что для предотвращения коллапса модели необходимо убедиться, что группы меньшинств в обучающих данных правильно распределены, чтобы сохранились их отличительные особенности.

Однако это трудно сделать, поскольку модели плохо обучаются на редких событиях. Кроме того, авторы рекомендуют ИИ-компаниям разделить в своих приложениях задачу прогнозирования участия человека в создании данных. Правила защиты данных для ИИ могут подорвать экономические преимущества компаний, делая их уязвимыми для судебных исков. Статья с изложением проблемы была опубликована в журнале arXiv.

Наталья Береговая

Ведущий автор рубрик «здоровье», «общество», «наука». Считаю, что журналист должен тщательно проверять информацию. А если ошибка все же произошла, нужно ее признать и извиниться.

Подписывайтесь на краткие, но содержательные новости со всего мира
глазами молодого поколения в Телеграм и ВКонтакте.

Апрель 2024
Пн	Вт	Ср	Чт	Пт	Сб	Вс
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

arXiv: исследователи ИИ предупредили о грядущем крахе моделей генерации контента

Похожие статьи

Почитайте также