вычислениями, требуемыми для обучения нейронных сетей.
TPU – тензорный процессор, разработанный специально для обучения нейронных сетей. –
Прим. авт. 22
Организация признана экстремистской и запрещена на территории РФ.
23
OpenAI Playground – это веб-приложение, которое позволяет пользователям исследовать и экспериментировать с моделями компании, включая GPT и DALL-E (инструмент для создания изображений с помощью искусственного интеллекта). – Прим. авт.
24
Обоснованность ответов – это процент «правильных ответов», то есть высказываний, которые можно подтвердить авторитетными внешними источниками. – Прим. авт.
25
Организация Meta (бывший Facebook Inc.) признана экстремистской и запрещена на территории РФ.
26
Принадлежит организации Meta, которая признана экстремистской и запрещена на территории РФ.
27
Организация признана экстремистской и запрещена на территории РФ.
28
Организация признана экстремистской и запрещена на территории РФ.
29
Эмерджентность – явление, когда в системе возникают новые свойства, не характерные для отдельных ее компонентов. – Прим. ред.
30
Терабайт (Тб) – единица измерения объема памяти или хранилища данных, примерно 1 триллион байт. – Прим. авт.
31
Rotten Tomatoes – американский сайт, собирающий обзоры фильмов и телепередач. – Прим. авт.
32
То есть модель сначала предсказывает следующее слово в предложении, а потом проверяет, правильно ли она его угадала. И так для каждого слова в тексте. – Прим. науч. ред.
33
Иногда, в более технических текстах, говорят про обучение с нулевой обучающей выборкой. – Прим. науч. ред.
34
Модель ничего не знает по теме и дает случайный ответ. – Прим. науч. ред.
35
Санитизация подразумевает удаление конфиденциальной информации из текста, а при обфускации или маскировке ее заменяют фиктивными или произвольными символами. – Прим. науч. ред.
36
В этом методе обучения используется некоторое человеческое вовлечение. При конструировании модели-оценщика используется составленный человеком (краудсорсинг) набор промптов, которые провоцируют нежелательные ответы. Но участие человека минимизировано по сравнению с другими способами обучения. – Прим. науч. ред.
37
VPN (virtual private network), или виртуальная частная сеть, – зашифрованное соединение через интернет между устройством и сетью. VPN создают зашифрованный туннель для данных и затрудняют вашу идентификацию, скрывая IP-адрес. – Прим. авт.
В РФ использование VPN для поиска запрещенного контента преследуется по закону. – Прим. ред.
38
Скандал разгорелся из-за того, что компания Facebook Inc. (c октября 2021 года – Meta; признана экстремистской и запрещена на территории РФ) разрешила британской консалтинговой фирме Cambridge Analytica собирать данные о 87 миллионах пользователей для политической рекламы25. – Прим. авт.
39
Процесс, обратный анонимизации, то есть обнаружение, к кому именно относятся анонимизированные персональные данные. – Прим. науч. ред.
40
Здесь было бы более уместно использовать термин «синтетический контент», чтобы избежать путаницы с «медиа» в смысле канала коммуникации. Но в английском языке «синтетические медиа» (synthetic media) традиционно используется именно в смысле контента, поэтому сохраним эту двусмысленность. – Прим. науч. ред.
41
Термины «сжатие» и «распаковка» не совсем точно передают суть процесса. Главным предназначением энкодера является не уменьшение размера изображения, а как раз выделение его латентных характеристик, подобно составлению краткого пересказа изображения на языке машины. – Прим. науч. ред.
42
В этом примере декодер запоминает индивидуальные узнаваемые черты лица, на котором он обучен. Энкодер, напротив, кодирует более «ситуативную» информацию – о положении лица, его действиях и, возможно, мимике. – Прим. науч. ред.
43
Агентство перспективных оборонных исследовательских проектов (Defense Advanced Research Projects Agency, DARPA) – научно-исследовательское агентство Министерства обороны США, ответственное за разработку новых технологий для использования военными. – Прим. авт.
44
Неоднородность фоточувствительности, или неодинаковость отклика пикселя (pixel response nonuniformity, PRNU), – шум с постоянным спектром, возникающий из-за неидеальности датчиков, которые используются в камерах и оптических инструментах. – Прим. авт.
45
Например, ненатурально редкое моргание. – Прим. науч. ред.
46
Принадлежит организации Meta, которая признана экстремистской и запрещена на территории РФ.
47
Принадлежит организации Meta, которая признана экстремистской и запрещена на территории РФ.
48
Репродуктивные права – часть законных (юридических) прав и свобод, связанных с воспроизводством и сексуальным здоровьем, которые различно понимаются и различно закреплены в разных странах мира. В РФ это доступ к качественной медицинской помощи, контрацепции, лечению бесплодия, свобода от принудительного вмешательства и т. д. Не поддерживаются аборты и отказ от деторождения. – Прим. ред.
49
Принадлежит организации Meta, которая признана экстремистской и запрещена на территории РФ.
50
На момент создания русского перевода большинство притязаний было отвергнуто, тем не менее истцы добились одной небольшой, но значимой победы: судья не принял аргументы компаний-ответчиков, что подобные иски могут подлежать раннему прекращению как подавляющие свободу слова. – Прим. науч. ред.
51
Социальная инженерия в контексте кибератак – это метод, при котором злоумышленники используют психологические манипуляции с людьми для получения конфиденциальной информации или доступа к их ресурсам. – Прим. науч. ред.
52
Вредоносное ПО – различные виды злонамеренного программного обеспечения, например вирусы и программы-вымогатели. – Прим. авт.
53
Фишинг – тип атаки с помощью социальной инженерии, при которой злоумышленник выдает себя за доверенный контакт и отправляет жертве вредоносные письма. – Прим. авт.
54
Атаки XSS, или межсайтовый скриптинг, – внедрение стороннего кода, как правило, устанавливающего связь с сайтами злоумышленников, на легитимные веб-сайты с целью кражи конфиденциальной информации. – Прим. авт.
55
По ценам конца 2023 года. – Прим. науч. ред.
56
Предоставление услуг по генерации, анализу и управлению вредоносным кодом через облачные сервисы. – Прим. науч. ред.
57
LAION‐400M – общедоступный набор данных, содержащий 400 миллионов пар изображений и их текстовых описаний на английском языке. – Прим. авт.
58
COYO‐700M – огромный общедоступный набор данных, содержащий 747 миллионов пар изображений и их текстовых описаний на английском языке. – Прим. авт.
59
DDoS (атака типа «отказ в обслуживании») – попытка сделать систему недоступной, например, из-за