Конференция Apsara в Ханчжоу. OpenAI и китайские стартапы запускают революционные ИИ-модели
Конференция Apsara в Ханчжоу. OpenAI и китайские стартапы запускают революционные ИИ-модели

На конференции Apsara в Ханчжоу, организованной Alibaba Cloud, представители китайских компаний, занимающихся искусственным интеллектом, рассказали о своих планах по созданию крупных языковых моделей. Это произошло после анонса OpenAI новой линейки LLM, включая модель o1, разработанную при поддержке Microsoft. Эта технология направлена на решение сложных задач, которая может ускорить развитие науки, программирования и математики. Один из основателей Moonshot AI Куньчжун Чжилинь отметил, что модель o1 способна изменить подход к разработке ИИ в разных отраслях. Он напомнил о законе масштабирования, согласно которому увеличение объема данных и размера моделей повышает их эффективность и подчеркнул, что такие подходы расширяют возможности ИИ, а модель o1 может открыть новые перспективы для стартапов. OpenAI указала, что новая система решает задачи, имитируя логику человека, улучшая стратегии и исправляя ошибки.

Представители других компаний подтвердили значимость подхода. Например, генеральный директор StepFun Цзян Дасин отметил, что вычислительные мощности остаются барьером для многих стартапов, особенно из-за ограничений США на поставку чипов. По его словам, потребности в производительности пока остаются высокими. Инсайдер Baichuan AI добавил, что лишь несколько китайских стартапов, включая Moonshot AI, Baichuan AI, Zhipu AI и MiniMax, могут позволить себе крупные инвестиции в усиленное обучение. Эти фирмы получили название «тигров ИИ» за активное участие в разработке новых моделей.

Alibaba Cloud представила обновленную линейку Qwen 2.5. В нее вошли версии с параметрами от 0.5 до 72 миллиардов, поддерживающие 29 языков, включая китайский, английский, французский и испанский. Особое внимание уделили специализированным моделям: Qwen2.5-Coder и Qwen2.5-Math, скачанным более 40 миллионов раз на платформах Hugging Face и ModelScope. Компания также запустила текстово-видео генератор в составе инструмента Tongyi Wanxiang. Технология позволяет создавать реалистичные и анимационные ролики, которые могут пригодиться в рекламе и кино.

Еще одной новинкой стал Qwen 2-VL — улучшенная версия модели для работы с изображениями и текстом. Она поддерживает обработку видео длиной свыше 20 минут, отвечает на вопросы, связанные с видеоматериалами, и оптимизирована для мобильных устройств и роботов. Эти разработки показывают, как быстро развивается рынок ИИ, где крупные компании и стартапы конкурируют за лидерство.