• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Наборы данных

В рамках исследовательской работы участниками НУГ собран ряд текстовых коллекций:

  • отзывы на рестораны (на русском, порядка 12 000):  Restaurants (ZIP, 2.13 Мб)  
  • отзывы на рестораны с сайта TripAdvisor (на русском, порядка 18 000):  reviews_tripadvisor (RAR, 2.82 Мб)  
  • отзывы на автомобили (на русском, порядка 35 000): automotive (ZIP, 5.42 Мб)   automotive_35k_feedbacks (ZIP, 90.49 Мб)  
  • база статей с русскоязычных сайтов (в основном новостные, федеральные и региональные):  russian_news_raw (ZIP, 29.05 Мб) 
  • аннотации к статьям по анализу данных (на английском, 68 933 статьи):
  1. "Сырые" данные: papers_raw (ZIP, 40.36 Мб)   
  1. Предобработанные данные в формате csv + описание полей:  papers_parsed (ZIP, 43.32 Мб)  
  2. Отфильтрованные данные из 80 релевантных журналов: papers_parsed_relevant (ZIP, 15.55 Мб)  

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.