Юлия
Стрелец

корреспондент ComNews.ru
© ComNews
19.08.2024

В сфере искусственного интеллекта (ИИ), как оказалось, существует серая зона, наполненная миллионами людей, которые работают анонимно. Их часто нанимают для обучения алгоритмов, но в конечном итоге они выполняют часть работы за ИИ. Кому мы больше доверяем обрабатывать наши данные - человеку или искусственному интеллекту? А если человек не является работником компании, куда мы отдали данные, - осознаем ли мы риски, что данные окажутся использованными против нас?

Недавно ComNews сообщал о следующем казусе: стартап, специализирующийся на автоматизации документов с помощью искусственного интеллекта, предлагает сторонним работникам выполнять задания, с которыми не справился ИИ. Эти задания размещаются на краудсорсинговой платформе "Яндекс Задания" и включают в себя перепечатку текста из документов, в частности, паспортов. Пользователи платформы пожаловались на низкую оплату за перепечатку текста, которая составляет всего 10 копеек.

"Яндекс Задания" работает следующим образом: компания размещает задания, а желающие выполнить их люди должны ввести в поле текст, который они видят на представленной картинке. Ставку за выполнение задачи на краудсорсинговой платформе определяет автор задания, а исполнители могут принять или отклонить задачу.

Пресс-служба стартапа объяснила, что компания размещает задания по оцифровке документов на сторонних краудсорсинговых площадках в дополнение к использованию искусственного интеллекта. ИИ способен распознать 95% штампов на печатных прописках в паспортах, но оставшиеся 5% требуют ручной проверки.

Перед тем как выложить документ на платформу, стартап, опять же с помощью ИИ, замазывает данные об имени и фамилии, чтобы владельца нельзя было узнать. Одной из претензий к такому типу работы с данными может быть неуверенность, что, во-первых, абсолютно все документы будут обезличены, во-вторых, что даже обезличенные документы не попадутся одному и тому же стороннему работнику и он точно не сможет их сопоставить и идентифицировать их владельца.

Пока о таких подтвержденных инцидентах неизвестно, и остается надеяться, что их не будет. Уверенность в этом придает позиция самой платформы "Яндекс Задания" - пресс-служба компании утверждает, что платформа модерирует весь контент и при необходимости имеет право заблокировать как отдельные задачи, так и аккаунт клиента.

Тем не менее этот стартап не скрывал механизмы работы, и все заказчики и инвесторы о нем осведомлены.

Другой пример, когда тайное становится явным и обнаруживается, что компания неофициально задействовала сторонних работников для помощи ИИ. В апреле 2024 года технология Just Walk Out от Amazon, позволяющая клиентам брать товары с полок и покидать магазин без оплаты на кассе, стала постепенно исчезать из продуктовых магазинов. Технология частично опиралась на работу более чем 1000 человек в Индии, которые просматривали и маркировали видео, чтобы убедиться в точности работы кассовых аппаратов.

Помимо этого, в августе 2023 года журналисты The Washington Post рассказали, что американские компании, нуждаясь в большом количестве данных для обучения моделей искусственного интеллекта, отдавали выполнять задания сторонним работникам с Филиппин.

Эти сотрудники занимались анализом видео, в которых они должны отличать пешеходов от пальм, что необходимо для разработки алгоритмов автоматического вождения. Они также маркировали изображения, чтобы искусственный интеллект мог создавать реалистичные изображения политиков и знаменитостей. Кроме того, они редактировали текстовые фрагменты, чтобы языковые модели не выдавали бессмысленных ответов. Согласно неофициальным оценкам филиппинского правительства, более двух миллионов человек на Филиппинах выполняют эту "тайную работу".

Хотя искусственный интеллект часто воспринимается как безлюдная технология машинного обучения, на самом деле он опирается на труд обычных людей, нуждающихся в подработке.

Но бывают и другие случаи, когда технологические компании, особенно начинающие, вынуждены прибегать к подлогу.

Пару лет назад я общалась со стартапером из Центральной Азии - настырным и энергичным парнем, которому было около 20 лет. Его стартап - это интеллектуальная система видеонаблюдения для подсчета посетителей в офлайн-магазинах. Когда основатель нашел первого крупного клиента, он потребовал от системы не только подсчета количества людей, но и анализ их пола, возраста и времени пребывания в магазине. И фаундер начал искать разработчиков искусственного интеллекта.

В процессе работы команда столкнулась с множеством проблем, включая необходимость обработки большого объема данных и обучения искусственного интеллекта. За день до презентации системы обнаружилось, что ее точность составляет всего 32%, но, несмотря на это, команда решила провести презентацию и получить первый заказ.

Презентация прошла успешно, и стартап получил деньги, что позволило им выплатить долги и зарплаты команде. Однако система все еще требовала доработки, поэтому команда продолжила ручной подсчет посетителей в течение двух с половиной месяцев, пока программисты обучали систему. В итоге они достигли точности в 80%, а затем в 98%.

Эта история показывает, что порой стартаперы могут осознанно идти на небольшой обман перед инвестором или заказчиком, чтобы наконец получить деньги банально на зарплату разработчику. Очевидно, что это крайние меры, риск. Но все же это временная мера.

Таким образом, в бизнесе разрешено все, что не запрещено законом. Это конкурентная среда, где каждый стремится завоевать нишу на рынке и продать решение выгоднее или, наоборот, сэкономить на каких-то процессах. Пользователя мало волнует, кто конкретно переписывает его данные из паспорта в информационную систему: штатный сотрудник, ИИ или какой-то студент, нашедший подработку на краудсорсинговой платформе. Для него важно лишь то, чтобы его паспорт не гулял по всему интернету и не попал в руки мошенников, которые, используя скомпрометированные паспортные данные, будут представляться сотрудниками банка или государственного органа.

Интересы инвестора и заказчика упираются в то, чтобы не потерять вложенные средства, репутацию и не попасть под угрозу получения оборотных штрафов за утечки персональных данных, которые вот-вот появятся в России. И поскольку именно заказчик несет основную ответственность за сохранность данных, ему предстоит тщательно разобраться, каким стартапам он может доверить данные клиентов, как этот стартап будет обеспечивать безопасность обработки этих данных, как данные будет обрабатывать ИИ или наемный работник. Возможно, именно компании-посредники, сторонние ресурсы - те самые краудфандинговые платформы - в качестве независимых игроков должны помогать поддерживать порядок в процессе обмена данными.