Федор
Прохоров

технический директор Cloud.ru (ООО "Облачные технологии")
© ComNews
24.07.2023

Глава Microsoft Брэд Смит сравнил активное развитие искусственного интеллекта в мировом ИТ-сообществе с появлением печатного станка. По мнению Смита, введение в жизнь пользователей технологий ИИ – фундаментальное открытие, которое позволит проводить исследования, больше общаться и лучше отбирать данные.

Информационный шум вокруг нейросетей не стихает уже больше года и точно не стихнет в ближайшее время. Он похож на шум вокруг блокчейна, Web3 и NFT, и здесь важно отделять хайп от того, в чем нейросети действительно могут быть полезны обществу.

Начнем с того, что называть нейросетями эти инструменты не совсем правильно. Самым верным будет именовать их мультимодальными генеративными моделями, так как они работают с разными видами информации. Они могут обрабатывать и генерировать аудио, текст, картинки, видео. Благодаря этому процессу нейронная сеть может обучаться на основе большого количества данных и делать прогнозы или генерировать контент на новых данных. В этом материале кейсы из 5 сфер жизни, где нейросети занимают уже не последнее место.

Медицина

Прежде всего речь о применении нейросетей в диагностике заболеваний, благодаря возможности оперировать значительным числом предыдущих диагнозов и медицинских кейсов. По мнению НТИ (Национальная технологическая инициатива) модель, которая обучена на профильном датасете, может справляться с постановкой диагноза на 5-10% точнее среднестатистического врача. Такая модель позволяет использовать диагностику везде, где есть интернет. Один из примеров таких мультимодальных систем – разработка медицинской компании Glass Health – Glass AI может поставить диагноз, основываясь на различных данных из анамнеза пациента. Такие разработки есть и в России: на рынке уже доступно решение, способное оперировать историей болезни и помогать врачам в диагностировании.

Софт может также удивить обработкой и анализом рентгеновских снимков. Например, Sber Med AI может поставить диагноз по вашему снимку, и делает это с 95% успехом в выявлении патологий. Модель совершает upscale (повышает разрешение) снимка и может быть главным помощником рентгенологов, работающих с дорогостоящими аппаратами КТ и МРТ.

В мае 2023 года заммэра Москвы Анастасия Ракова рассказала об использовании в одной из больниц города технологий ИИ для постановки диагноза рассеянного склероза как раз по снимкам МРТ, также с 2020 ИИ успешно используется по всей стране для диагностики COVID.

Технологии машинного обучения также активно двигаются в сторону создания новых фармацевтических препаратов. Модели помогают виртуально моделировать новые молекулы и определять их свойства, просчитывать дозы действующих веществ, предсказывать влияние новых лекарств на течение болезней. Недавно ученые из Торонтского университета заявили, что с помощью ИИ смогли разработать препарат, показывающий отличные результаты в излечении рака печени. Обученная ими платформа Pharma на базе искусственного интеллекта AlphaFold разработала препарат менее чем за месяц, хотя обычно на разработку таких лекарств уходят годы или даже десятилетия.

Образование и работа

Крупные и мощные мультимодальные системы умеют вычленять из гигантских текстов суть и оформлять ее в грамотную аннотацию. Это может помочь в обучении, написании научных работ, значительно ускорить работу с большими объемами информации. В России уже доступны такие модели, причем на бесплатной основе. Они могут подготовить краткое содержание материала и выделить его главные тезисы.

Это работает и в обратную сторону. Модели создадут большой текст по одной только аннотации, нарисуют бесконечное количество полезных карточек, диаграмм и таблиц для научных работ, подготовят презентации и расшифруют интервью. Большее из вышеперечисленного умеет уже ставший популярным ChatGPT, а вслед за ним похожие продукты создали в Google (Bard). В России созданы несколько похожих моделей.

Существуют также AI-репетиторы. Эти модели разрабатывают план обучения, находят необходимую информацию, подают ее пользователю в нужных порциях. Одна из таких моделей разработана Томским Государственным Университетом. Она называется Plario и может подготовить школьника к ЕГЭ по математике.

Маркетинг

Маркетологи очень долго говорили о необходимости сегментировать аудитории и дробить их на микросегменты. Крупные ИТ-компании, которые копят в своих базах данных информацию о большом количестве пользователей, уже сегодня могут делить контент и создавать его персонализировано под одного конкретного пользователя. AI помогает им в создании уникального контента. Это всё уже работает на благо крупных поисковиков (в том числе российских), рекламные пространства которых подают интересную информацию каждому отдельному пользователю.

Развивается технология deepfake с участием моделей на базе технологий машинного обучения. Раньше машине нужна была целая куча фотографий человека с разных ракурсов, а также 15 датчиков на теле, чтобы сымитировать его движения. Сейчас модели могут создавать deepfake-ролики вообще без участия человека, буквально по нескольким фотографиям. Мы делали такой проект совместно с крупной торговой сетью, а в главной роли у нас был цифровой аватар актрисы Ольги Медынич.

Контент и развлечения

Мультимодальные системы развиваются настолько быстро, что уже могут создавать концепции вселенных компьютерных игр, сценарии к ним, персонажей и "скины" для отдельных элементов. В России, как и за рубежом, многие студии уже используют технологии ИИ. К примеру, российский разработчик игр Денис Шевченко считает, что моделям уже можно доверить рутинную работу в виде отрисовки загрузочных экранов и NPC-персонажей для диалогов и сайд-миссий, а еще ИИ годится для отрисовки ретро-игр в большем разрешении.

В конце мая компания Nvidia на выставке Computex 2023 показала будущее видеоигр: компания представила возможность встраивать обработку и генерацию голоса в любую видеоигру.

Уже совсем скоро вы сможете общаться с персонажами игр своим голосом, а не выбирать заготовленные варианты. При этом персонажи будут осмысленно отвечать, используя сгенерированный контент, и даже анимация мимики будет совпадать с речью.

Еще один хороший пример: в Беларуси ИТ-стартап создал и обучил модель, которая на основе идеи и концепта может написать киносценарий, разработать сценарный план, придумать, где, как и когда каждый из актеров будет сниматься в сценах, тем самым заменив собой группу из 10-15 работников съемочной площадки.

С помощью моделей можно сделать неограниченное количество клипов с участием музыкантов, живших в разное время, превратить условного Фредди Меркьюри во фронтмена Imagine Dragons и "заставить" его спеть песню "Believer". Звучит это, к слову, крайне неплохо.

Сельское хозяйство и промышленность

Особенно актуальными мультимодальные модели стали в сельскохозяйственной и промышленной сфере. Производители тяжелой техники активно внедряют искусственный интеллект в свои разработки. Таким образом, автономные машины и механизмы появились во всех областях сельского хозяйства и промышленности: круглосуточные комбайны, самосвалы, экскаваторы. Особенно актуально это для тех случаев, где требуется бесперебойная работа техники, а также в условиях, которые для человека не представляются безопасными: в шахтах, на склонах, в карьерах и так далее. Все подобные разработки связаны с машинным зрением. И речь не только о сельскохозяйственной технике, но еще и о транспорте: в Красноярске, например, уже целый год ездят трамваи с датчиками, регулирующие движение транспорта.

Запчасти для большегрузной техники также создаются с помощью моделей и использования 3D-принтеров, так как порой очень сложно быстро раздобыть какую-то редкую деталь или запчасть и оперативно доставить её к месту ремонта. Более того, многие концерны публикуют официальные 3D-макеты, чтобы не тратить большие средства на производство и логистику, а также обслуживание машин.

Мультимодальные системы также участвуют в автоматизации процессов в промышленности и других сферах, где очень сложно эти самые процессы отслеживать. ИИ может выявлять нарушения на конвейерах, в разработке, предупреждать нарушения там, где очень важна быстрая реакция на проблемные точки.

Итоги

В России развитие искусственного интеллекта во многом будет зависеть от компаний-трендсеттеров, которые будут двигать мультимодальные системы в массы. Они уже пользуются большой популярностью: по данным Naked Science, более 2 тысяч российских компаний вовлечены в проекты с искусственным интеллектом.

Еще больше предпосылок для продвижения ИИ лежат в развитии в стране технологий машинного обучения и облачных систем: на сегодняшний день от этих ИТ-сфер во многом зависит способность бизнеса к автоматизации.

Мы все находимся в процессе освоения искусственного интеллекта и пока не совсем понимаем, каким будет его развитие. Многие боятся искусственного интеллекта, многие восхищаются и стараются как можно больше вовлекать его в свою повседневную жизнь.

Одно стоит сказать точно: за всем этим технологическим великолепием стоят и будут стоять люди, без которых модели не обучатся и не смогут прогрессировать. Конечно, развитие нейросетей бесконечно впечатляет. Но нельзя не учитывать риски, о которых я попробую рассказать в одном из следующих текстов.