» » » » Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

На нашем литературном портале можно бесплатно читать книгу Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры, Жан-Батист Мишель . Жанр: Научная Фантастика. Онлайн библиотека дает возможность прочитать весь текст и даже без регистрации и СМС подтверждения на нашем литературном портале litmir.org.
Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
Название: Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
ISBN: 978-5-17-088935-8
Год: 2016
Дата добавления: 12 декабрь 2018
Количество просмотров: 265
Читать онлайн

Внимание! Книга может содержать контент только для совершеннолетних. Для несовершеннолетних просмотр данного контента СТРОГО ЗАПРЕЩЕН! Если в книге присутствует наличие пропаганды ЛГБТ и другого, запрещенного контента - просьба написать на почту readbookfedya@gmail.com для удаления материала

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры читать книгу онлайн

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - читать бесплатно онлайн , автор Жан-Батист Мишель
Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.
1 ... 53 54 55 56 57 ... 71 ВПЕРЕД
Перейти на страницу:
Конец ознакомительного фрагментаКупить книгу

Ознакомительная версия. Доступно 11 страниц из 71

Поэтому мы решили, вооружившись n-грамами, провести напоследок эксперимент и проверить, насколько предсказуемы исторические изменения. Мы протестировали самые простые из возможных прогнозов, которые иногда называют «культурной инерцией». Согласно ей, n-грамы, двигавшиеся вверх, продолжат свое движение вверх, а двигавшиеся вниз будут и дальше двигаться вниз. Фондовый рынок не имеет инерции – в противном случае отличным инвестором смог бы стать каждый. Если же человеческая культура демонстрирует инерцию, то мы сможем многое узнать о будущем n-грама, анализируя его развитие в прошлом.

И вот какой график нарисовала нам машина[219]:



Линией серого цвета мы обозначили среднюю частоту большого количества n-грамов, выбранных нами из-за того, что они демонстрировали последовательное снижение за 20-летний период. Сохраняется ли тенденция по окончании этого периода? Да, причем на протяжении десятилетий. Черным цветом мы выделили другую группу n-грамов, которая стабильно росла за 20-летний период. Ее резкий рост продолжается на протяжении почти столетия – в тех пределах, в которых нам удалось произвести измерения. И результат был тем же самым – прежде росшие n-грамы продолжили срой рост, а снижавшиеся продолжали снижаться. Иными словами, n-грамы, находившиеся в движении, продолжали его (до тех пор, пока на них не начинали действовать психоисторические силы).

Возможно, что наука прогнозирования истории – это не фикция. Нельзя исключать, что наша культура следует детерминистическим законам. И возможно, именно об этом скажут когда-нибудь наши данные.

Но даже если прогнозирование возможно, действительно ли нам это нужно? Конт полагал именно так. Он верил, что при отсутствии объективных измерений, без опровергаемых предсказаний, наше понимание человеческой истории, общества и культуры будет неполным.

Антрополог Франц Боас с этим не соглашался[220]:


Физик сравнивает аналогичные факты, из которых выделяет общее явление. Вследствие этого отдельные факты становятся для него менее важными, поскольку его интересуют общие закономерности.

С другой стороны, факты представляют собой крайне важный и интересный объект для любого историка… Какой из двух методов имеет более высокую ценность? Ответ может быть лишь субъективным…


Скажем о том же коротко: иногда вы хотите посмотреть на график, а иногда – увлечься хорошей книгой.

Добро пожаловать в историю в формате цифрового будущего. Почему бы не попробовать оба способа?

Приложения

Великие битвы истории

Дилеммы

Дуэли

Религия


Наука


Наука

Социальные изменения

Экономика

Еще немного экономики

049



Окружающая среда

Мир

Инженерные науки

Вечный бой

Болезни

Медицина

Еда

Напитки

Игры и развлечения

Ночная жизнь

Жизнь тяжела

Новые времена

Великие умы

Мудрые слова

О графиках

Графики в этой книге были созданы под впечатлением от великолепного визуального стиля веб-комикса xkcd авторства Рэндалла Манро (http://xkcd.com/). Идея автоматизации создания графиков в стиле xkcd была предложена Дэймоном Макдугаллом. Графики в самой книге создавались в программе Python, с использованием модифицированной версии программы Джейка Вандерпласа. Эти n-грамы можно создавать интерактивно на сайте Google Ngram Viewer: http://books.google.com/ngrams/, а в стиле xkcd – по адресу http://xkcd.culturomics.org. Мы надеемся, что Манро не будет на нас в обиде (см. http://xkcd.com/1007/ и http://xkcd.com/1140/). Некоторые из его любимых n-грамов можно найти по адресу: http://xkcd.com/ngram-charts/.

Обратите внимание, что данные приводятся с учетом регистра, а вид графиков n-грамов зависит от нескольких параметров. Если в заметках не указано иное, то все графики n-грамов, приведенные в тексте книги, в точности соответствуют результатам работы Google Ngram Viewer, при использовании корпуса English 2012 и трехлетнего сглаживания. Также, если не указано иное, текст запроса приводится полностью в нижнем регистре, за исключением имен собственных, которые пишутся как обычно. Все соответствующие массивы данных для работы можно загрузить по адресу: http://goo.gl/3IIA9.

При упоминании конкретных n-грамов, таких как Marc Chagall и Kubismus в корпусе на немецком языке, они указываются в виде NV: «Marc Chagall, Kubismus»/German. В случае если корпус не указан (например, NV: «cubism»), использовался корпус English 2012. В ряде случаев мы указываем диапазон лет или значение параметра сглаживания.

Примечания

1

В самой Конституции Соединенные Штаты упоминаются во множественном числе. К примеру: «Государственной изменой Соединенным Штатам считается только ведение войны против них…» См. U.S. Const., art. III, § 3. (Здесь и далее примечания авторов, если не оговорено иное. – Прим. ред.)

2

Цит. по.: McPherson James M. Battle Cry of Freedom. Oxford: Oxford University Press, 1988. P. 859. (Здесь и далее для удобства читателя в ссылках на литературу имя автора следует за фамилией. Имена приводятся в том виде, в каком они написаны авторами. – Прим. ред.)

3

Ознакомительная версия. Доступно 11 страниц из 71

1 ... 53 54 55 56 57 ... 71 ВПЕРЕД
Перейти на страницу:
Комментариев (0)