Компания Foxconn официально представила свою первую крупную языковую модель. Нацеленную на трансформацию производственных процессов и управление цепочками поставок. Новая модель под названием «FoxBrain» прошла обучение на 120 графических процессорах Nvidia H100, а весь процесс занял всего около 4-х недель, сообщил крупнейший в мире контрактный производитель электроники.
Компания, которая собирает iPhone для Apple и также производит серверы искусственного интеллекта для Nvidia, заявила, что их модель основана на архитектуре Llama 3.1 от Meta. Это первая на Тайване крупная языковая модель с возможностями рассуждения, оптимизированная для традиционного китайского языка и тайваньских языковых стилей.
Foxconn признаёт, что существует небольшой разрыв в производительности по сравнению с дистилляционной моделью китайской компании DeepSeek, однако общая производительность FoxBrain очень близка к мировым стандартам.
Первоначально разработанный для внутренних приложений, FoxBrain охватывает анализ данных, поддержку принятия решений, совместную работу с документами, математические вычисления, рассуждения и решение проблем, а также генерацию кода.
Foxconn планирует сотрудничать с технологическими партнерами для расширения применения модели, делиться информацией с открытым исходным кодом и продвигать искусственный интеллект в производстве, управлении цепочками поставок и интеллектуальном принятии решений.
Nvidia оказала поддержку через свой тайваньский суперкомпьютер «Taipei-1» и предоставила технические консультации во время обучения модели, сообщает Foxconn.