Наборы данных
В рамках исследовательской работы участниками НУГ собран ряд текстовых коллекций:
- отзывы на рестораны (на русском, порядка 12 000): Restaurants (ZIP, 2.13 Мб)
- отзывы на рестораны с сайта TripAdvisor (на русском, порядка 18 000): reviews_tripadvisor (RAR, 2.82 Мб)
- отзывы на автомобили (на русском, порядка 35 000): automotive (ZIP, 5.42 Мб) automotive_35k_feedbacks (ZIP, 90.49 Мб)
- база статей с русскоязычных сайтов (в основном новостные, федеральные и региональные): russian_news_raw (ZIP, 29.05 Мб)
- аннотации к статьям по анализу данных (на английском, 68 933 статьи):
- "Сырые" данные: papers_raw (ZIP, 40.36 Мб)
- Предобработанные данные в формате csv + описание полей: papers_parsed (ZIP, 43.32 Мб)
- Отфильтрованные данные из 80 релевантных журналов: papers_parsed_relevant (ZIP, 15.55 Мб)
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.