Модели искусственного интеллекта (Artificial intelligence (AI)) от Китая

Больше
29 янв 2025 16:53 - 29 янв 2025 17:37 #222 от roman
Модель искусственного интеллекта (ИИ-модель) DeepSeek ( www.deepseek.com ) была разработала Китайской компанией DeepSeek-AI (深度求索), которая специализируется на разработке ИИ. Языковая модель DeepSeek-R1 обучена с использованием менее продвинутых и более дешевых чипов по сравнению с решениями от лидеров отрасли — таких, как OpenAI и Anthropic. 
Благодаря архитектуре на каждом этапе обработки данных активируется только часть параметров, что обеспечивает высокую эффективность и производительность. Обучение модели обошлось китайской компании в $5.6 млн, против оценки от $100 млн до $1 млрд  для аналогичных моделей в США. Фокус разработчиков был на оптимизации данных и алгоритмов, а не на мощности производительности серверов с ИИ, что теоретически может снизить значимость инфраструктуры в развитии AI (искусственного интеллекта). Важно отметить, что код ИИ-модель DeepSeek  публикуется в открытом доступе как и алгоритмы по оптимизации, которые позволили им достичь таких результатов.
 
Последнее редактирование: 29 янв 2025 17:37 пользователем roman.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

Больше
29 янв 2025 17:31 - 29 янв 2025 17:35 #223 от roman
При этом DeepSeek является только одним из четырех перспективных проектов КНР в сфере искусственного интеллекта (Artificial intelligence (AI))
Все проекты искусственного интеллекта имеют открытый программный код, пользуются поддержкой правительства и работают в условиях санкций США:
- DeepSeek (DeepSeek)
- Doubao (ByteDance)
- Kimi (Moonshot AI)
- Qwen (Alibaba)
Последнее редактирование: 29 янв 2025 17:35 пользователем roman.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

Больше
29 янв 2025 18:10 - 29 янв 2025 18:12 #224 от roman
Другим представителем стала модель искусственного интеллекта Qwen2.5-Max от крупнейшей в мире онлайн B2B торговой платформы Alibaba ( chat.qwenlm.ai ). По опубликованным материалам модель искусственного интеллекта Qwen2.5-Max является мощнее модели искусственного интеллекта DeepSeek и GPT-4o

Модель искусственного интеллекта Qwen  опережает DeepSeek V3 во всех топовых бенчмарках – Arena Hard, LiveBench, LiveCodeBench, GPQA-Diamond
 
 
Модель искусственного интеллекта Qwen способна на:
➖Генерирует фотореалистичные изображения;
➖Создаёт видео высокого качества;
➖Пишет код на уровне сеньор-разработчиков;
➖Находит информацию в интернете;
Кроме всего прочего API полностью совместимо с OpenAI .
Последнее редактирование: 29 янв 2025 18:12 пользователем roman.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

Работает на Kunena форум
Статистика сайта:
Яндекс.Метрика