Фото: blogs.3ds.com

arXiv: исследователи ИИ предупредили о грядущем крахе моделей генерации контента

Исследователи из Великобритании и Канады предупреждают, что широкая популярность технологии генеративного искусственного интеллекта может привести к опасным последствиям, пишет Хайтек+.

Чатботы, основанные на таких моделях, как ChatGPT, обучаются на огромных объемах данных, и многие ведущие компании активно используют такой генеративный ИИ. Проблема в том, что машинное обучение ИИ на сгенерированных данных может обрушить обученные модели, что может привести к неадекватному контенту и большему количеству ошибок.

«Мы обнаружили, что использование генерируемого моделью контента в обучении приведет к необратимым дефектам в будущих поколениях моделей», — заявили ученые.

Коллапс модели происходит, когда ИИ получает все больше и больше данных, сгенерированных самим ИИ. Постепенно модель становится менее эффективной, а ее ответы теряют вариативность. Исследователи считают, что для предотвращения коллапса модели необходимо убедиться, что группы меньшинств в обучающих данных правильно распределены, чтобы сохранились их отличительные особенности.

Однако это трудно сделать, поскольку модели плохо обучаются на редких событиях. Кроме того, авторы рекомендуют ИИ-компаниям разделить в своих приложениях задачу прогнозирования участия человека в создании данных. Правила защиты данных для ИИ могут подорвать экономические преимущества компаний, делая их уязвимыми для судебных исков. Статья с изложением проблемы была опубликована в журнале arXiv.

 

Поделиться:

Подписывайтесь на краткие, но содержательные новости со всего мира
глазами молодого поколения в Телеграм и ВКонтакте.

Почитайте также

Российские ученые разработали ИИ программу для выявления дислексии у детей

148 Российские ученые из Центра искусственного интеллекта НИУ ВШЭ разработали уникальную систему машинного обучения «Дислектор», …