

g960293014, 17 декабря 2010 г., 21:02
Интернет-корпорация Google опубликовала в открытом доступе базу данных, состоящую из более чем 5 миллионов 200 тысяч оцифрованных книг. Это цифровое хранилище состоит из более чем 500 миллиардов слов, которые упоминаются в книгах на русском, английском, французском, испанском, немецком и китайском языках, опубликованных в период между 1500 и 2008 годами. "Склад" слов доступен для скачивания или через поисковик любому пользователю. По мнению экспертов, этот корпус, включающий в себя частоту использования слов и коротких фраз, откроет новые возможности для исследований в области гуманитарных наук. Хотя эта база данных в основном предназначена для ученых, с ее помощью любой пользователь может "вбить" запрос, состоящий из нескольких словосочетаний, и посмотреть, как в течение последних 500 лет изменялась частота их использования. В частности, благодаря цифровому хранилищу Google можно узнать, что слово "женщины" (women) по сравнению с "мужчинами" (men) редко упоминается в литературе на английском языке до начала 1970-х годов, когда начинает набирать силу феминистское движение. Линии на диаграмме, отражающие частоту использования этих слов в книгах, сравниваются примерно в 1986 году. С помощью этого архива также можно узнать, что легендарная американская актриса Мэрилин Монро и диснеевский персонаж Микки Маус не уделялось столько же внимания в печати по сравнению с экс-президентом США Джимми Картером, отмечает "The New York Times". Кроме того, этот "склад" слов показывает, что в начале 1800-х годов общество принимало новые достижения в области технологий за 66 лет, а в период между 1880 и 1920 годами - всего лишь в течение 27 лет. Ранее Google объявила о планах оцифровать Кумранские рукописи (также известные как "Свитки Мертвого моря") - древние манускрипты, содержащие почти все книги еврейской Библии (за исключением книги Эсфирь). По оценкам специалистом, возраст этих текстов и апокрифов составляет более 2 тысяч лет.
Источник: www.vesti.ru/doc.html?id=414689&cid=780 Ваш
неописуемый


Просмотров: 165
Подписок на автора: 0
Поделиться