• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Языки

Корпусы текстов 87 языков
есть у НУГ для анализа.
Данные языки представляют 21
языковую семью
Язык Семья Ветвь Число говорящих Количество текстов Word order Locus of marking Alignment Morphological complexity Head directionality Subject Side Parameter Null Subject Parameter/ Pro‐drop Parameter Compounding parameter (TCP) Nominal Mapping Parameter The Wh-Movement Parameter
Abkhaz Абхазо-адыгская Абхазо-абазинская               SOV CNSL -TCP MM Wh-in-situ
Adyghe Абхазо-адыгская Адыгская                        
Aguaruna Хиварская Хиварская                        
Amharic Афраазийская Семитская 32 млн 1 337 SOV Inconsistent Accusative Synthetic LL SOV CNSL -TCP FM Wh-Movement
Arabic Афраазийская Семитская 310 млн 670 SVO Inconsistent Accusative Synthetic R VSO (Modern Standard), SVO (other dialects) CNSL -TCP CM Wh-Movement
Armenian Индоевропейская Греко-фригийско-армянская                        
Assyrian Афраазийская Семитская                        
Atikamekw Алгская Алгонкинская 6 000 1 584 SVO Dependent Accusative Synthetic R Discourse-Prominent CNSL +TCP FM Wh-in-situ
Avar Нахско-дагестанская Аваро-андо-цезская                        
Azerbaijani Алтайская Тюркская                        
Bamana (Bambara) Нигеро-конголезская Манде                        
Bartangi Индоевропейская Индоиранская                        
Bashkir Алтайская Тюркская                        
Basque Изолированные Изолированные 750 000 10 052 SOV Inconsistent Ergative Synthetic LL SOV CNSL -TCP FM Wh-Movement
Belarusian Индоевропейская Балто-славянская 6.7 млн 10 311 SVO Dependent Accusative Synthetic R          
Bengali Индоевропейская Индоиранская 230 млн 29 076 SOV Dependent Accusative Synthetic R SOV discourse-pro-drop -TCP MM Wh-in-situ
Bulgarian Индоевропейская Балто-славянская 9 млн 734 SVO Dependent Accusative Synthetic R SVO CNSL -TCP CM MWhF
Chechen Нахско-дагестанская Нахская 1.5 млн 20 152 SOV Dependent Ergative Synthetic LL SOV CNSL -TCP FM  
Chinese Сино-тибетская Китайская 918 млн 8 242 SVO Dependent Neutral Isolating LL SVO (Mandarin) CNSL +TCP (Mandarin) MM (Mandarin)  Wh-in-situ
Coptic Афраазийская Египетская - 1 322 SVO Dependent Accusative Analytic LR SVO non-null-subject -TCP Rigid Mapping Wh-movement
Crimean Tatar Алтайская Тюркская                        
Czech Индоевропейская Балто-славянская 10.7 млн 10 144 SVO Dependent Accusative Synthetic RL SVO CNSL -TCP FM MWhF
Danish Индоевропейская Германская               SVO NNSL +TCP FM Wh-Movement
Dholuo Нило-сахарская Восточносуданская 4.2 млн 66 VSO Dependent Accusative Analytic RL SVO discourse-pro-drop -TCP FM Wh-in-situ
Dutch Индоевропейская Германская 24 млн 2 387 SOV Inconsistent Accusative Analytic R No dominant order PNSL +TCP CM Wh-Movement
English Индоевропейская Германская 375 млн 11 052 SVO Dependent Accusative Analytic LR SVO NNSL +TCP FM Wh-Movement
Erzya Уральская Мордовская                        
Esperanto Искусственные Искусственные - 176 Free RI Accusative Synthetic L          
Estonian Уральская Финская               SVO PNSL +TCP CM Wh-in-situ
Faroese Индоевропейская Германская                        
Finnish Уральская Финская 5.5 млн 3 385 SVO Inconsistent Accusative Synthetic LL SVO PNSL +TCP FM mainly Wh-in-situ
French Индоевропейская Романская 77 млн 3 528 SVO Inconsistent Accusative Synthetic RR SVO NNSL -TCP CM Wh-Movement (optional)
German Индоевропейская Германская 76 млн 12 503 SVO Dependent Accusative Analytic R No dominant order PNSL +TCP CM PWh-Movement
Hindi Индоевропейская Индоиранская 341 млн 1 043 SOV Inconsistent Accusative Analytic LL SOV CNSL -TCP FM Wh-in-situ
Hungarian Уральская Угорская                        
Icelandic Индоевропейская Германская 314 000 21 356 SVO Dependent Accusative Synthetic LL SVO CNSL +TCP CM Wh-Movement
Indonesian Австронезийская Малайско-полинезийская 43 млн 3 267 SVO Zero Accusative Synthetic RR SVO discourse-pro-drop -TCP MM PWh-Movement
Inuktitut Эскимосско-алеутская Эскимосская                        
Italian Индоевропейская Романская               SVO CNSL -TCP FM Wh-Movement
Japanese Японо-рюкюская Японская 130 млн 15 302 SOV Dependent Neutral Synthetic LL SOV CNSL +TCP FM Wh-in-situ
Kabyle Афраазийская Берберская -   SVO Dependent Neutral Synthetic LL SVO CNSL -TCP FM Wh-in-situ
Kashmiri Индоевропейская Индоиранская               SOV NNSL +TCP FM PWh-Movement
Kazakh Алтайская Тюркская 18 млн 2 090 SOV Dependent Accusative Synthetic R SOV CNSL -TCP FM Wh-in-situ
Komi-zyryan Уральская Пермская                        
Korean Алтайская Корейская               SOV CNSL +TCP MM Wh-in-situ
Kyrgyz Алтайская Тюркская                        
Lao Тай-кадайская Тайская                        
Latin Индоевропейская Италийская - 7 819 SOV Dependent Accusative Synthetic LL SVO or SOV CNSL -TCP FM MWhF
Latvian Индоевропейская Балто-славянская 1.5 млн 152 983 (sentences) SVO Dependent Accusative Synthetic RR SVO CNSL -TCP FM Wh-fronting in questions; optional in-situ in colloquial speech
Lithuanian Индоевропейская Балто-славянская               SVO CNSL +TCP FM Wh-Movement
Luxembourgish Индоевропейская Германская                        
Malayalam Дравидийская Южнодравидийская 38 млн 10 041 SOV Dependent Ergative Synthetic LL SOV discourse-pro-drop -TCP FM Wh-in-situ
Mooré Нигеро-конголезская Бенуэ-конголезская                        
Navajo На-дене Атабаскская 170 000 20 614 SOV Dependent Accusative Synthetic LL SOV CNSL +TCP FM Wh-in-situ
Norwegian Индоевропейская Германская 5 млн 4 124 SVO Dependent Accusative Analytic LR SVO NNSL +TCP CM Wh-Movement (with optional in-situ strategy context)
Oromo Афраазийская Кушитская 35 млн 66 SOV Dependent Accusative Synthetic LL SOV CNSL -TCP FM Wh-in-situ
Ossetian Индоевропейская Индоиранская 50 000 1 168 SOV Dependent Accusative Synthetic LL          
Persian Индоевропейская Индоиранская 70 млн 1 381 SOV Inconsistent Accusative Synthetic RR SOV CNSL +TCP MM Wh-in-situ
Portuguese Индоевропейская Романская               SVO CNSL PNSL (Brazilizn Portuguese) +TCP -TCP (Brazilizn Portuguese) CM Wh-Movement
Punjabi Индоевропейская Индоиранская 125 млн 28 884 SOV Dependent Accusative Synthetic LL          
Quechua Кечуанская Кечуанская 8-10 млн 41 566 SOV Inconsistent Accusative Synthetic LL SOV CNSL -TCP FM Wh-in-situ
Romanian Индоевропейская Романская 3-5 млн 2 374 SVO Dependent Accusative Synthetic RR SVO CNSL -TCP FM [+arg, -pred], MWhF
Russian Индоевропейская Балто-славянская 260 млн 6 429 SVO Dependent Accusative Synthetic R SVO CNSL -TCP FM MWhF
Serbian Индоевропейская Балто-славянская 12 млн   SVO Dependent Accusative Synthetic L SVO CNSL -TCP Mixed mapping MWhF
Sinhala Индоевропейская Индоиранская 16 млн 15 004 SOV Dependent Accusative Synthetic L SOV CNSL -TCP MM Wh-in-situ
Slovak Индоевропейская Балто-славянская               SVO CNSL -TCP MWhF Wh-Movement
Slovenian Индоевропейская Балто-славянская               SVO CNSL -TCP MWhF  
Spanish Индоевропейская Романская 460 млн 8 522 SVO Inconsistent Accusative Synthetic RR SVO CNSL -TCP CM Wh-Movement
Swahili Нигеро-конголезская Бенуэ-конголезская 50-100 млн 1 517 SVO Inconsistent Accusative Synthetic RR SVO CNSL -TCP CM MWhF
Swedish Индоевропейская Германская 10 млн   SVO Dependent Accusative Analytic LR SVO NNSL +TCP MM Wh-Movement
Tabasaran Нахско-дагестанская Лезгинская 125 000 2 337 SOV Dependent Ergative Synthetic R SOV CNSL -TCP MM Wh-in-situ
Tagalog Австронезийская Малайско-полинезийская 28 млн 1 000 VSO Inconsistent Neutral Analytic RR VSO or VOS CNSL -TCP MM MWhF
Tatar Алтайская Тюркская 7 млн 5 072 SOV Dependent Accusative Synthetic LL SOV CNSL -TCP FM Wh-in-situ
Telugu Дравидийская Юго-восточная                        
Thai Тай-кадайская Тайская 60 млн 5 585 SVO Inconsistent Neutral Analytic RR SVO NNSL +TCP MM Wh-in-situ
Tibetan Сино-тибетская Тибето-бирманская                        
Turkish Алтайская Тюркская 70-80 млн 1 308 SOV Inconsistent Accusative Synthetic LL SOV CNSL +TCP FM Wh-in-situ
Tuvan Алтайская Тюркская 200 000 5 337 SOV Dependent Accusative Synthetic LL SOV CNSL +TCP FM Wh-in-situ
Udmurt Уральская Пермская 300 000 1 740 SOV Dependent Accusative Synthetic LL SOV CNSL -TCP MM Wh-in-situ
Ukrainian Индоевропейская Балто-славянская 33 млн 10 052 SVO Dependent Accusative Synthetic LR SVO CNSL -TCP FM MWhF
Uzbek Алтайская Тюркская 32 млн 10 533 SOV Inconsistent Accusative Synthetic LL SOV CNSL -TCP MM Wh-in-situ
Vietnamese Австроазиатская Мон-кхмерская 90 млн 1 071 SVO Zero Neutral Isolating RR SVO discourse-pro-drop language. +TCP MM Wh-in-situ
Welsh Индоевропейская Кельтская                        
Wolof Нигеро-конголезская Бенуэ-конголезская                        
Yiddish Индоевропейская Германская               SVO/SOV NNSL +TCP FM MWhF
Yoruba Нигеро-конголезская Бенуэ-конголезская                        


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.