и Хелен Грейнер. –
Прим. автора. 55
Facebook принадлежит компании Meta, которая признана экстремистской организацией в России. – Прим. ред.
56
Если автомобиль едет сам, то кто же этот «сам»? – Прим. автора.
57
Возможно, вы удивлены, что автомобиль стал экспонатом в музее воздухоплавания и астронавтики. Причина в том, что Stanley использовал спутниковую навигационную систему GPS. – Прим. автора.
58
Себастьян Трун (р. 1967) – ученый и предприниматель, руководивший разработкой Stanley. Позже он основал секретную лабораторию Google X, где родились проекты беспилотных автомобилей Google (ныне Waymo) и умных очков Google Glass.
59
Ян Лекун (р. 1960) – французский информатик, лауреат премии Тьюринга, один из создателей глубокого обучения (Deep Learning). Его критика Софии связана с тем, что подобные проекты создают у публики ложное представление об ИИ как о магии, отвлекая от реальных научных достижений.
60
Не знаю, почему история искусственного интеллекта отличается таким количеством преждевременных смертей, но так оно и есть. – Прим. автора.
61
Мне посчастливилось получить свою докторскую степень на том же отделении, только спустя десять лет после Хинтона. – Прим. автора.
62
Дэвид Румельхарт (1942–2011) – когнитивный психолог, который, в отличие от многих «технарей» в ИИ, искал вдохновение в структуре человеческой памяти. Он был лидером исследовательской группы PDP (Parallel Distributed Processing), возродившей интерес к нейросетям в 1980-х.
63
Сеппо Линнайнмаа (р. 1945) – финский математик и информатик. В своей магистерской диссертации 1970 года он описал «режим обратного автоматического дифференцирования» – математический метод, который спустя десятилетия лег в основу обучения нейросетей, хотя сам автор изначально не связывал его с ИИ.
64
Лев Семенович Понтрягин (1908–1988) – выдающийся советский математик, потерявший зрение в 14 лет, что не помешало ему стать академиком. Его работы по теории оптимального управления («Принцип максимума Понтрягина») косвенно предвосхитили методы настройки параметров в сложных системах, включая нейросети.
65
ImageNet – проект, изменивший парадигму искусственного интеллекта. До него ученые пытались улучшить алгоритмы; ImageNet доказал, что ключ к успеху – в гигантских объемах размеченных данных.
66
Amazon Mechanical Turk – краудсорсинговая платформа, где люди выполняют задачи, с которыми пока не справляются компьютеры (например, отличить кошку от собаки на фото). Название отсылает к «Механическому турку» XVIII века – шахматному автомату, внутри которого прятался живой шахматист.
67
Илья Суцкевер (р. 1986) – канадский информатик родом из СССР (Нижний Новгород), ученик Хинтона. Он стал ключевым звеном между академической наукой и индустрией: после прорыва с AlexNet он стал сооснователем и главным научным сотрудником OpenAI, стоявшим у истоков ChatGPT. Сейчас Илья работает над созданием AGI (Artificial general intelligence – сильный (общий) искусственный интеллект) в созданном им стартапе Safe Superintelligence Inc.
68
“Attention Is All You Need” – название этой научной статьи стало культовым. В ней впервые была описана архитектура трансформера (Transformer), которая позволила нейросетям обрабатывать весь текст целиком, а не по словам, и уделять «внимание» связям между далекими друг от друга словами.
69
Приведенный выше пример иллюстрирует идеальный сценарий работы алгоритма BPE (Byte Pair Encoding). Его главный принцип: чем чаще слово встречается в обучающих текстах, тем выше вероятность, что нейросеть запомнит его как единый токен. Редкие же слова дробятся на части. Однако на практике токенизация русского языка в моделях (подобных GPT) часто выглядит более дробной и хаотичной, чем в английском. Причина в том, что огромная часть обучающих данных для этих моделей – англоязычная. Словарь модели «переполнен» английскими корнями, а для кириллицы места остается меньше. Поэтому если английское слово secret модель запомнит как один токен, то русское «секрет» она может разбить на цепочку символов (например, «с», «ек», «рет»), так как не «видела» его достаточно часто, чтобы сформировать единый токен. В нашем примере мы адаптировали разбивку так, чтобы продемонстрировать саму логику работы современных трансформеров (выделение морфем и основ), игнорируя техническое несовершенство работы с кириллицей в конкретных версиях токенизаторов.
70
В английском языке слово “queen” означает не только монарха, но и пчелиную матку (Queen bee). Поскольку модель обучалась на английских текстах, для нее слово «королева» семантически и математически связано со словом «пчела», что неочевидно в русском переводе.
71
BERT (Bidirectional Encoder Representations from Transformers) – революционная модель Google. Ее прорыв в том, что она читает текст не слева направо, а «бидирекционально» – видит все предложение целиком, понимая контекст слова сразу с двух сторон.
72
GLUE (General Language Understanding Evaluation) – стандартный набор тестов для проверки «интеллекта» нейросетей. Он включает в себя задачи на логику, определение тональности текста и понимание парафраз. Если модель набирает высокий балл в GLUE, считается, что она хорошо «понимает» язык.
73
На момент редактирования книги последняя версия модели от OpenAI – GPT–5.2. Нельзя сказать, что она близко подошла к AGI.
74
По состоянию на январь 2025 года «внутренний роутер» (система управления моделями) настроен так, чтобы принудительно активировать поиск в интернете для фактологических запросов. Это компенсирует недостаток «веса» информации в обучающей выборке и минимизирует риск галлюцинаций. Теперь ChatGPT отвечает на этот вопрос верно, хотя модель сама по себе может и не «знать» эту информацию.
75
Джарон Ланье (р. 1960) – автор термина «виртуальная реальность». Его скепсис к ИИ базируется на концепции «маоизма данных»: он считает, что ИИ-компании фактически крадут жизненный опыт людей (их тексты, картины, код) для обучения моделей, не выплачивая авторам ни цента, что обесценивает человеческий труд.
76
Theme Park (1994) – эта игра стала революционной не только из-за экономической модели, но и благодаря ИИ: каждый посетитель парка был автономным «агентом» со своим уровнем счастья, голода и тошноты. Именно попытка смоделировать сложное поведение толпы через простые реакции индивидов стала одной из идейных основ будущего DeepMind.
77
«Момент Спутника» (Sputnik moment) – устойчивое выражение в американской публицистике, означающее шок от осознания технологического отставания, который мобилизует нацию на рывок. Барак Обама использовал этот термин в 2011 году, призывая США инвестировать в науку, чтобы не проиграть Китаю.
78