Network


Latest external collaboration on country level. Dive into details by clicking on the dots.

Hotspot


Dive into the research topics where Andrejs Vasiļjevs is active.

Publication


Featured researches published by Andrejs Vasiļjevs.


Archive | 2012

Language Technology Support for Latvian

Inguna Skadiņa; Andrejs Veisbergs; Andrejs Vasiļjevs; Tatjana Gornostaja; Iveta Keiša; Alda Rudzīte

Language technologies are software systems designed to handle human language and are therefore often called “human language technology”. Human language comes in spoken and written forms. While speech is the oldest, and in terms of human evolution the most natural form of language communication, complex information and most human knowledge is stored and transmitted in written texts. Speech and text technologies process or produce these different forms of language, though they both use dictionaries and rules of grammar and semantics. This means that language technology (LT) links language to various forms of knowledge, independently of the media (speech or text) it is expressed in illustrates the LT landscape. When we communicate, we combine language with other modes of communication and information media—for example, speaking can involve gestures and facial expressions. Digital texts link to pictures and sounds. Movies may contain language in spoken and written form. In other words, speech and text technologies overlap and interact with other technologies that facilitate the processing of multimodal communication and multimedia documents. In the following, we will discuss the main application areas of language technology, i. e., language checking, web search, speech technology, and machine translation. This includes applications and basic technologies such as:


international conference on computational linguistics | 2013

Domain adaptation in statistical machine translation using comparable corpora: case study for english latvian IT localisation

Mārcis Pinnis; Inguna Skadiņa; Andrejs Vasiļjevs

In the recent years, statistical machine translation (SMT) has received much attention from language technology researchers and it is more and more applied not only to widely used language pairs, but also to under-resourced languages. However, under-resourced languages and narrow domains face the problem of insufficient parallel data for building SMT systems of reasonable quality for practical applications. In this paper we show how broad domain SMT systems can be successfully tailored to narrow domains using data extracted from strongly comparable corpora. We describe our experiments on adaptation of a baseline English-Latvian SMT system trained on publicly available parallel data (mostly legal texts) to the information technology domain by adding data extracted from in-domain comparable corpora. In addition to comparative human evaluation the adapted SMT system was also evaluated in a real life localisation scenario. Application of comparable corpora provides significant improvements increasing human translation productivity by 13.6% while maintaining an acceptable quality of translation.


Archive | 2012

Risks for our Languages and a Challenge for Language Technology

Inguna Skadiņa; Andrejs Veisbergs; Andrejs Vasiļjevs; Tatjana Gornostaja; Iveta Keiša; Alda Rudzīte

We are witnesses to a digital revolution that is dramatically impacting communication and society. Recent developments in digital information and communication technology are sometimes compared to Gutenberg’s invention of the printing press. What can this analogy tell us about the future of the European information society and our languages in particular?


Archive | 2012

Valodu Tehnoloģiju Atbalsts Latviešu Valodai

Inguna Skadiņa; Andrejs Veisbergs; Andrejs Vasiļjevs; Tatjana Gornostaja; Iveta Keiša; Alda Rudzīte

Valodu tehnoloģijas ir programmatūras sistēmas, kas izstrādātas darbam ar cilvēka valodu, tādēļ tās bieži dēvē par cilvēka valodas tehnoloģijām. Cilvēka valoda pastāv runas un rakstu formā. Lai arī vecākā un saistībā ar cilvēka evolūciju visdabiskākā valodas saziņas forma ir runa, sarežģīta informācija un lielākā daļa cilvēces zināsanu tiek glabātas un nodotas tālāk rakstiski. Runas un teksta tehnoloģijas apstrādā vai rada sīs atsķirīgās valodas formas, lai arī tās abas izmanto vārdnīcas, gramatikas un semantikas likumus. Tas nozīmē, ka valodu tehnoloģijas (VT) veido valodas saikni ar dažādās formās glabātām zināsanām neatkarīgi no veida (runas vai teksta), kādā informācija izteikta. attēlā ilustrēta VT daudzveidība. Sazinoties mēs kombinējam valodu ar citiem saziņas veidiem un informācijas līdzekļiem — piemēram, runātājs papildu informāciju var paust ar žestiem un mīmiku. Digitālie teksti veido saikni ar attēliem un skaņām. Filmu valoda var būt gan mutiskā, gan rakstiskā formā. Citiem vārdiem, runas un teksta tehnoloģijas pārklājas un mijiedarbojas ar citām tehnoloģijām, un tas atvieglo multimodālās saziņas un multivides dokumentu apstrādi.


Archive | 2012

Risks Mūsu Valodām Un Izaicinājums Valodu Tehnoloģijām

Inguna Skadiņa; Andrejs Veisbergs; Andrejs Vasiļjevs; Tatjana Gornostaja; Iveta Keiša; Alda Rudzīte

Mēs esam liecinieki digitālajai revolūcijai, kas atstājusi milzu ietekmi uz saziņu un sabiedrību. Pēdējie digitālās informācijas un sakaru tehnoloģijas jaunumi nereti tiek salīdzināti ar Johana Gūtenberga izgudroto iespiedpresi. Ko sis salīdzinājums varētu mums pavēstīt par Eiropas informācijas sabiedrības nākotni un jo īpasi par mūsu valodām?


Archive | 2012

About Meta-Net

Inguna Skadiņa; Andrejs Veisbergs; Andrejs Vasiļjevs; Tatjana Gornostaja; Iveta Keiša; Alda Rudzīte

META-NET is a Network of Excellence partially funded by the European Commission. The network currently consists of 54 research centres in 33 European countries. META-NET forges META, the Multilingual Europe Technology Alliance, a growing community of language technology professionals and organisations in Europe. META-NET fosters the technological foundations for a truly multilingual European information society that:


Archive | 2012

Par META-NET

Inguna Skadiņa; Andrejs Veisbergs; Andrejs Vasiļjevs; Tatjana Gornostaja; Iveta Keiša; Alda Rudzīte

META-NET ir Eiropas Komisijas finansēts izcilības tīkls. Sajā tīklā sobrīd apvienojusies 54 pētniecības centri no 33 Eiropas valstīm. META-NET veido Daudzvalodu Eiropas tehnoloģisko savienību (Multilingual Europe Technology Alliance, META), kas ir augosa Eiropas valodu tehnoloģijas speciālistu un organizāciju kopiena. META-NET stiprina daudzvalodīgas Eiropas informācijas sabiedrības tehnoloģiskos pamatus, tādējādi:


Archive | 2012

Latviešu Valoda Eiropas Informācijas Sabiedrībā

Inguna Skadiņa; Andrejs Veisbergs; Andrejs Vasiļjevs; Tatjana Gornostaja; Iveta Keiša; Alda Rudzīte

Latviesu valoda ir vienīgā valsts valoda Latvijas Republikā, viena no Eiropas Savienības oficiālajām valodām. Visā pasaulē latviesu valoda ir dzimtā valoda apmēram 1,5 miljoniem iedzīvotāju. No tiem 1,2 miljoni dzīvo Latvijā, bet pārējie izkaisīti ASV, Krievijā, Austrālijā, Kanādā, Lielbritānijā, Vācijā, Īrijā, kā arī Lietuvā, Igaunijā, Zviedrijā, Brazīlijā un vēl citās valstīs. Lai arī latviesu valodas pratēju ir salīdzinosi maz, starp 6900 pasaules valodām tā ir 150. vietā runājoso skaita ziņā. Papildus savai dzimtajai valodai latviesu valodu māk vismaz 500 000 cittautiesu. Kops neatkarības atgūsanas 1990. gadā latviesu valoda ir valsts valoda, un sis statuss attiecas uz visām valodas lietosanas jomām. Tāpēc aizvien vairāk Latvijā dzīvojoso minoritāsu pārstāvju runā arī latviski. Pēc 1989. gada tautas skaitīsanas datiem tolaik latviski runāja apmēram 23% Latvijas minoritāsu pārstāvju. Saskaņā ar 2000. gada tautas skaitīsanas datiem nacionālo minoritāsu vidē latviesu valodas pratēju skaits bija pieaudzis līdz 53%.


Archive | 2012

Latvian in the European Information Society

Inguna Skadiņa; Andrejs Veisbergs; Andrejs Vasiļjevs; Tatjana Gornostaja; Iveta Keiša; Alda Rudzīte

Latvian is the sole state language in the Republic of Latvia and one of the official languages of the European Union. There are about 1.5 million native Latvian speakers worldwide, of which 1.2 million live in Latvia, while the rest are scattered throughout the USA, Russia, Australia, Canada, UK, Germany, Ireland, as well as Lithuania, Estonia, Sweden, Brazil, and other countries. Latvian, though apparently small, is in fact approximately the 150th most spoken language from about 6,900 languages of the world. At least 500,000 non- Latvians speak Latvian besides their own native language. Since regaining independence in 1990, Latvian has had a state language status which extends to all spheres of language use. As a result, more and more minority language speakers in Latvia also now speak Latvian. The 1989 population census data showed that 23% of Latvia’s national minorities spoke the Latvian language. According to the 2000 population census data, the number of Latvian speakers among national minorities increased to 53%.


language resources and evaluation | 2012

Collecting and Using Comparable Corpora for Statistical Machine Translation

Inguna Skadiņa; Ahmet Aker; Nikos Mastropavlos; Fangzhong Su; Dan TufiÈ; Mateja Verlic; Andrejs Vasiļjevs; Bogdan Babych; Paul D. Clough; Robert J. Gaizauskas; Nikos Glaros; Monica Lestari Paramita

Collaboration


Dive into the Andrejs Vasiļjevs's collaboration.

Top Co-Authors

Avatar
Top Co-Authors

Avatar
Top Co-Authors

Avatar
Top Co-Authors

Avatar
Top Co-Authors

Avatar
Top Co-Authors

Avatar
Top Co-Authors

Avatar
Top Co-Authors

Avatar
Top Co-Authors

Avatar
Top Co-Authors

Avatar
Researchain Logo
Decentralizing Knowledge