не мог осознать, что они присутствуют при смене эпох. Что паровой двигатель не просто заменит лошадей — он перекроит карты мира, создаст новые классы, уничтожит старые ремесла, породит профсоюзы, социал-демократию, мировые войны и туристические поездки на море. Что скорость, которую они увидели, станет проклятием и благословением их правнуков.
Они просто смотрели на чудо и не понимали, что это их последний день в старом мире.
На недавнем заседании Всемирного экономического форума искусственный интеллект назвали паровым двигателем четвертой промышленной революции[73]. И это не случайно. Лучшие умы человечества, независимо от уровня оптимистичности прогноза, ожидают от ИИ полной смены парадигмы ведения бизнеса, государственного управления и сильного изменения уклада жизни людей.
Поэтому в центре нашего разговора окажутся ключевые тенденции в области искусственного интеллекта. Именно через эту технологию мы и посмотрим на будущее данных.
В этой главе мы изучим те тренды, которые уже сегодня, прямо сейчас, пробиваются сквозь асфальт нашей привычной жизни, и попробуем понять, куда они нас приведут. Ведь будущее, как известно, наступает не вдруг. Оно не падает с неба в сиянии славы. Оно собирается по кусочкам, по кирпичикам из наших сегодняшних решений. Из того, кого мы назначаем ответственным за данные сегодня. Из того, закрываем ли мы глаза на «мелкие» ошибки в отчетах или разбираемся с ними. Из того, учим ли мы своих сотрудников работать с информацией или надеемся, что как-нибудь «само рассосется».
Итак, в этой главе мы поговорим о том:
• как связаны данные и ИИ и почему это вопрос не только прибыли, но и государственного суверенитета;
• как этичное обращение с данными поможет вашему бизнесу выжить;
• какой из глобальных трендов возьмет верх: движение к открытым биржам данных или тотальная приватность — и как это повлияет на ваш бизнес;
• к чему может привести демократизация данных и технологий;
• почему ИИ сделает управление данными невидимым и как именно это произойдет;
• как грамотность в управлении данными поможет вам быть эффективными в личном и профессиональном плане;
• какую роль в мире будущего могут сыграть CDO или люди, понимающие базовые принципы управления данными.
Искусственный интеллект и данные: мировой и национальный контекст
Развитие технологий уже давно обогнало способность бизнеса их осваивать. Лучшим учебником по стратегии все чаще оказывается не отчет международного консультанта, а научная фантастика, помноженная на взгляд современных философов. Ведь и фантасты, и философы сначала придумывают мир, а потом инженеры его строят. Бизнес же часто начинает строить, не представляя, в каком мире ему предстоит жить.
Фантасты, как люди с богатым воображением, рисуют миры, где многим из нас придется искать новую работу[74]. Или, скажем, зарабатывать на жизнь просмотром рекламы, которую доставляют прямо в мозг[75]. Звучит жутковато. Но кто знает, может, через двадцать лет это будет такой же обыденностью, как сегодня заказ еды через приложение.
Философы тем временем напоминают нам про фундаментальную проблему. К тому моменту, когда у искусственного интеллекта действительно появится что-то похожее на субъективный опыт или феноменальное сознание, мы, скорее всего, так и не договоримся, что это вообще такое[76]. И по этой, а также по множеству других причин, нам прогнозируют экзистенциальную катастрофу[77]. Тоже, знаете ли, не фонтан.
А вот бизнесмены и венчурные инвесторы, как люди практичные, говорят о другом. Они обещают, что сильный ИИ — тот, который превзойдет 90% людей в 90% задач, — появится уже к 2030 году[78]. И это, по их глубокому убеждению, приведет общество к невиданному экономическому процветанию, а человечество — к избавлению от болезней и, возможно, от смерти[79]. Сказка? Вполне. Но как в нее хочется верить, особенно когда смотришь на платежи по кредитам и сообщения о новых вирусах.
МИРОВОЙ И НАЦИОНАЛЬНЫЙ КОНТЕКСТ
Пока фантасты пугают нас рекламой в мозге, философы спорят о природе сознания, а бизнесмены рисуют райские кущи, правительства более шестидесяти стран, включая Россию, уже приняли национальные стратегии развития искусственного интеллекта[80].
И знаете почему? Не потому, что премьер-министры зачитываются Азимовым по ночам. А потому что битва за ИИ сегодня — гонка вооружений XXI века.
Посмотрите, что происходит вокруг. Санкции, технологические блокады, войны за микрочипы.
• США всеми силами пытаются удержать мировое лидерство в теме ИИ, ограничивая поставки чипов на экспорт и тормозя внедрение регулирования в технологичных штатах[81].
• Китай штампует роботов, строит государственные биржи данных, обгоняя США по количеству публикаций и патентов по ИИ.
• Европа закручивает гайки приватности, запрещает опасные ИИ-модели и ограничивает действие международных интернет-платформ.
• Россия создает свои суперкомпьютеры и большие языковые модели, пока отставая от бесспорных лидеров — США и Китая, — но все активнее набирая обороты.
Страны соревнуются в мощности суперкомпьютеров, количестве публикаций в топовых научных журналах, точности больших языковых моделей. Каждый ИИ-ученый в стране — на вес золота. Каждый дополнительный килофлопс[82] в секунду для суперкомпьютера — национальный праздник. Каждый новый источник данных для модели — надежда на мировое технологическое лидерство и суверенитет.
И если для совершенствования ИТ-инфраструктуры и воспитания молодых ученых требуются годы, а иногда и десятилетия, то подключение новых источников данных в модели порой занимает часы. Конечно, если данные:
• доступны;
• качественны;
• не несут в себе юридических рисков.
ДОСТУПНЫЕ И КАЧЕСТВЕННЫЕ: ДАННЫЕ ДЛЯ ФУНДАМЕНТАЛЬНЫХ ИИ-МОДЕЛЕЙ
Для ИИ нужно очень много данных. Гигантские массивы качественной, размеченной, проверенной информации. Чем больше данных — тем лучше модель. Чем лучше модель — тем сильнее страна. Поэтому государства будут делать все, чтобы эти данные у них были. Собирать, накапливать, структурировать. До тех пор, пока они не закончатся.
Стоп. А разве данные могут закончиться?
Да, и это сегодняшняя реальность.
Еще недавно мы слышали, что живем в мире избытка информации. «Каждые два года количество информации, производимой человечеством, удваивается»[83], — твердили нам ученые и СМИ. И мы боялись утонуть в информационном шуме.
Теперь же инженеры кремниевых душ говорят: да, мы производим данные с немыслимой ранее скоростью, но даже ее недостаточно для постоянного повышения качества больших языковых моделей. И прогнозируют, что данные во всем интернете закончатся до 2032 года[84]. На это влияет также политика интернет-сайтов, которые ограничивают использование данных для обучения ИИ.
Однако ученых это не останавливает. Прямо сейчас они взяли курс на самое быстрое решение проблемы — использование синтетических данных. Иначе говоря, сгенерированных специально для обучения генеративного ИИ. И кто, как вы думаете, их генерирует? Правильно: генеративный ИИ.
Иногда это действительно помогает. Например, недальновидно и негуманно по отношению к людям тренировать беспилотные автомобили реагировать на неожиданные ситуации на дорогах по камерам видеонаблюдений,