15:18 BharatGen: суверенная LLM Индии с поддержкой более 22 языков | |
Издание Indian Infrastructure сообщает, что индийский министр Джитендра Сингх Рана (Jitendra Singh Rana) назвал «BharatGen» первой в Индии суверенной многоязычной и многомодальной моделью обучения на базе искусственного интеллекта с большим объемом знаний (LLM). Министру рассказали, что BharatGen — это первая суверенная попытка Индии создать LLM, которая по-настоящему отражает языковое, культурное и социальное разнообразие нации. Созданная для поддержки более 22 региональных индийских языков, BharatGen объединяет три основных модальности: текст, речь и документальное зрение, чтобы она могла понимать, генерировать и интерпретировать информацию так же, как естественным образом общаются граждане Индии. Министру рассказали, что эта миссия была задумана в духе построения инклюзивного цифрового будущего, где каждый индийский язык, диалект и региональный контекст представлены в возможностях ИИ страны. Между тем, в презентации подчеркивалось, что BharatGen поддерживается в рамках Национальной миссии по междисциплинарным киберфизическим системам (NM-ICPS) Министерства науки и технологий, при этом 2,35 млрд индийских рупий направляются через инновационный центр технологий в IIT Bombay. В консорциум, возглавляемый Индийским технологическим институтом Бомбея (ныне Мумбаи), входят такие учреждения, как Индийский технологический институт Мадраса (ныне Ченнаи), Индийский технологический институт Канпура, Индийский технологический институт Хайдарабада, Индийский технологический институт Манди, Индорский технологический институт Индора, Индийский технологический институт Харагпура и Индийский технологический институт Дели. Он отметил, что объединение усилий этих учреждений знаменует собой новую эру совместных исследований, ориентированных на выполнение поставленных задач, и отражает растущую мощь Индии в области технологических инноваций. Кроме того, ключевой компонент BharatGen, Bharat Data Sagar, был представлен как одна из самых амбициозных инициатив в области данных, реализуемых в стране. Министру сообщили, что Bharat Data Sagar разрабатывается для обеспечения полного владения и контроля Индии над своими цифровыми информационными ресурсами. Благодаря масштабному сбору и обработке данных, ориентированных на Индию, с участием отдельных лиц, учреждений и организаций из разных секторов, инициатива направлена на создание наборов данных, отражающих реалии жизни, культурные особенности и региональное разнообразие Индии. Это обеспечивает не только точность работы ИИ, но и укрепляет долгосрочный цифровой суверенитет Индии. Министр рассмотрел выпущенные на данный момент модели BharatGen. Команда представила Param-1, основополагающую текстовую модель с 2,9 миллиардами параметров, обученную на 7,5 триллионах токенов, при этом более трети обучающих данных представляют индийский контент. BharatGen также создала речевые модели, такие как Shrutam, систему автоматического распознавания речи с 30 миллионами параметров, и Sooktam, модель преобразования текста в речь с 150 миллионами параметров, доступную на девяти индийских языках. Кроме того, в рамках проекта была создана Patram, первая в Индии модель распознавания документов с семью миллиардами параметров, обученная на 2,5 миллиардах токенов, предназначенная для понимания и интерпретации сложных документов в индийских форматах. Министр оценил, что вместе эти модели образуют полный стек ИИ для Индии — текст, речь и зрение, способный поддерживать управление, промышленность, образование, сельское хозяйство, здравоохранение и цифровую инклюзивность. Кроме того, в ходе взаимодействия команда продемонстрировала экспериментальные приложения, созданные на базе BharatGen. Среди них были Krishi Sathi — голосовой консультационный инструмент для мессенджеров, позволяющий фермерам задавать вопросы на родном языке и получать мгновенную поддержку; e-VikrAI, который автоматически генерирует описания продуктов по одному изображению, помогая мелким продавцам расширять своё цифровое присутствие; и Docbodh — платформа вопросов и ответов (Q&A) для документов, разработанная Patram и делающая сложные тексты понятными для граждан. Министр отметил, что такие приложения наглядно демонстрируют, как ИИ может напрямую улучшить повседневную жизнь и сделать государственные услуги более доступными для людей. Команда проинформировала министра, что BharatGen укрепляется благодаря глубокому отраслевому партнерству с IBM, Zoho, NASSCOM и несколькими министерствами, включая Министерство водных ресурсов и санитарии Индии, а также с правительствами штатов. Это сотрудничество объединяет опыт Индии, местные наборы данных и отраслевые проблемы, позволяя BharatGen превратиться в масштабируемую, развертываемую и влиятельную экосистему ИИ для страны. Было также подчеркнуто, что BharatGen недавно получил дополнительную поддержку в размере 10,58 млрд рупий от MeitY. Министр отметил, что такие миссии демонстрируют готовность Индии стать движущей силой следующей волны цифровой трансформации и подтверждают способность страны занимать лидирующие позиции в таких секторах, как ИИ, квантовые, космические системы и высокие технологии. Министр высоко оценил масштаб, амбициозность и техническую глубину инициативы BharatGen, назвав ее поворотным моментом на пути Индии к технологической самодостаточности. Он заявил, что BharatGen — это не просто технологический проект, а общенациональная инициатива, призванная обеспечить, чтобы будущее искусственного интеллекта отражало стремления, языковые особенности и жизненный опыт 1,4 миллиарда индийцев. Он также подчеркнул, что такие инициативы, как BharatGen, воплощают в себе видение о расширении прав и возможностей каждого гражданина посредством науки и технологий, создании инклюзивных, надёжных и учитывающих местные особенности систем, а также обеспечении того, чтобы цифровая история Индии писалась самими индийцами. В заключение министр призвал команду BharatGen продолжать разрабатывать модели, соответствующие мировым стандартам, но при этом уникальные для Индии, масштабируемые, но доступные, технологически продвинутые, но достаточно простые для граждан. Он также отметил, что BharatGen сыграет определяющую роль в формировании цифрового будущего Индии и позволит стране внести значимый вклад в глобальный ландшафт искусственного интеллекта.
Изображение: флаг Индии, by Onkarphoto on Unsplash | |
|
| |
| Всего комментариев: 0 | |