Исследователи из Великобритании и Канады предупреждают, что широкая популярность технологии генеративного искусственного интеллекта может привести к опасным последствиям, пишет Хайтек+.
Чатботы, основанные на таких моделях, как ChatGPT, обучаются на огромных объемах данных, и многие ведущие компании активно используют такой генеративный ИИ. Проблема в том, что машинное обучение ИИ на сгенерированных данных может обрушить обученные модели, что может привести к неадекватному контенту и большему количеству ошибок.
«Мы обнаружили, что использование генерируемого моделью контента в обучении приведет к необратимым дефектам в будущих поколениях моделей», — заявили ученые.
Коллапс модели происходит, когда ИИ получает все больше и больше данных, сгенерированных самим ИИ. Постепенно модель становится менее эффективной, а ее ответы теряют вариативность. Исследователи считают, что для предотвращения коллапса модели необходимо убедиться, что группы меньшинств в обучающих данных правильно распределены, чтобы сохранились их отличительные особенности.
Однако это трудно сделать, поскольку модели плохо обучаются на редких событиях. Кроме того, авторы рекомендуют ИИ-компаниям разделить в своих приложениях задачу прогнозирования участия человека в создании данных. Правила защиты данных для ИИ могут подорвать экономические преимущества компаний, делая их уязвимыми для судебных исков. Статья с изложением проблемы была опубликована в журнале arXiv.
Ведущий автор рубрик «здоровье», «общество», «наука». Считаю, что журналист должен тщательно проверять информацию. А если ошибка все же произошла, нужно ее признать и извиниться.