В середине мая в калифорнийском Беркли состоялось закрытое мероприятие, объединившее тридцать признанных математиков со всего мира. Целью этой встречи было проверить интеллектуальные способности чат-бота o4-mini — новой языковой модели от OpenAI, обладающей развитым логическим аппаратом. Как сообщает Scientific American, ученым было предложено составить задачи, которые бы оказались не по зубам даже такой продвинутой системе. Итоги этого своеобразного соревнования удивили даже самых скептически настроенных участников: оказалось, что искусственный интеллект уже способен конкурировать с профессионалами высочайшего уровня.
Инициатором эксперимента стала некоммерческая организация Epoch AI, специализирующаяся на оценке прогресса крупных языковых моделей. Для испытания возможностей o4-mini был подготовлен набор из 300 оригинальных математических задач различной сложности. Если предыдущие версии ИИ успешно решали менее 2% подобных примеров, то новая модель продемонстрировала качественный скачок, справившись почти с 20% заданий. Однако наиболее значимым этапом стал финальный тур, в рамках которого участники встречи должны были придумать десять принципиально сложных задач. Каждая из них сулила награду в размере 7500 долларов при условии, что нейросеть окажется неспособной выдать корректное решение.
Особый резонанс вызвал случай с математиком Кеном Оно из Университета Вирджинии, который возглавлял мероприятие. Увидев, с какой легкостью ИИ разбирается с предложенными задачами, он решился на отчаянный шаг — дал чат-боту открытую научную проблему из области теории чисел, которую обычно включают в докторские диссертации. Реакция машины стала откровением: за десять минут она самостоятельно изучила соответствующие научные источники, решила упрощенную версию задачи, а затем представила оригинальное и корректное решение, отметив, что оно не заимствовано, а получено в ходе собственных вычислений.
После этого эпизода Кен Оно признал, что нейросеть действует как настоящий исследователь, демонстрируя не просто алгоритмическое поведение, а мышление, близкое к человеческому. Хотя в итоге математикам удалось найти десять задач, которые ИИ не смог решить, масштабы его интеллектуального прогресса вызвали всеобщее удивление. Некоторые сравнили взаимодействие с o4-mini с работой с одаренным аспирантом, который во многом превосходит своих преподавателей.
Еще одним фактором, вызвавшим обеспокоенность, стала скорость работы ИИ. Там, где человеку требуются недели размышлений и проверок, нейросеть справляется за минуты. Ученые отметили и потенциальную опасность чрезмерного доверия: модель излагает свои рассуждения с такой уверенностью, что может ввести в заблуждение даже опытного математика. Это явление, которое участники назвали «доказательством через устрашение», способно привести к принятию ошибочных выводов без должной проверки.
На завершающей дискуссии ученые заговорили о трансформации роли математика в условиях стремительного развития искусственного интеллекта. Всё больше специалистов приходит к выводу, что в будущем человек может стать научным куратором для ИИ — направлять его, ставить задачи и интерпретировать полученные открытия. По мнению Кена Оно, игнорировать потенциал подобных технологий — значит упустить важнейший этап в развитии науки.
Члены СДПГ опубликовали сенсационный манифест. В нем социал-демократы призывают отказаться от размещ...
Новый анализ останков двух «щенков», возраст которых составляет более 14 000 лет, показал, что они, ...
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".