Töötame selle nimel, et taastada Unionpedia rakendus Google Play poes
VäljuvSaabuva
🌟Lihtsustasime oma kujundust paremaks navigeerimiseks!
Instagram Facebook X LinkedIn

Teksti normaliseerimine

Index Teksti normaliseerimine

Teksti normaliseerimine on loomuliku keele töötluses ebastandardsele tekstile standardse vaste leidmine.

Sisukord

  1. 21 suhted: Akronüüm, Algoritm, Andmebaas, Digiteerimine, Foneetika, Juhendamata masinõpe, Juhendatud masinõpe, Kõnesüntees, Keelekorpus, Keelenorm, Keelenorming, Levenshteini kaugus, Loomuliku keele töötlus, Masintõlge, Ortograafia, Süntaks, Sõnaliik, Sõnastik, Sõne (andmetüüp), SMS, Tehisnärvivõrk.

Akronüüm

Akronüüm (vanakreeka sõnadest ἄκρος akros 'äärmine' ja ὄνυμα onyma 'nimi') on sõnana häälduv ühend, mis on moodustunud mitme sõna algustähtedest.

Vaata Teksti normaliseerimine ja Akronüüm

Algoritm

Algoritm on astmeline tegevusjuhis, juhend või eeskiri mingi tegevuse sooritamiseks või eesmärgi saavutamiseks.

Vaata Teksti normaliseerimine ja Algoritm

Andmebaas

Andmebaas on korrastatud infokogum.

Vaata Teksti normaliseerimine ja Andmebaas

Digiteerimine

Horisont kõige esimest, 1967. aasta jaanuaris ilmunud numbrit Digiteerimine ehk digimine on füüsilise objekti või analoogmaterjali (kunstiteos, helisalvestis, kaart, kiri, kolmemõõtmelised objektid vms) digitaalsele kujule viimine.

Vaata Teksti normaliseerimine ja Digiteerimine

Foneetika

Foneetika ehk häälikuõpetus on keeleteaduse osa, mille huviobjektiks on inimkõne kui heli, uuritavateks nähtusteks prosoodia ja segmentaalfoneemid ehk häälikud.

Vaata Teksti normaliseerimine ja Foneetika

Juhendamata masinõpe

Juhendamata masinõppe alla liigitatakse ülesandeid masinõppes, mille eesmärk on leida tunnustest peidetud struktuure, mustreid ning gruppe kasutades selleks objektide sarnasust.

Vaata Teksti normaliseerimine ja Juhendamata masinõpe

Juhendatud masinõpe

Juhendatud masinõppeks nimetatakse ülesandeid masinõppes mille eesmärgiks on leida funktsioone, mis seostavad sõltumatuid ja sõltuvaid tunnuseid vastavalt olemasolevatele sõltumatu/sõltuv tunnuspaaridele.

Vaata Teksti normaliseerimine ja Juhendatud masinõpe

Kõnesüntees

Kõnesüntees (inglise keeles speech synthesis) on inimkõne kunstlik produtseerimine kas inimhääle omaduste sünteesimise abil või salvestatud inimkõne üksuste (foneemid, difoonid, sõnad vms) ühendamise teel.

Vaata Teksti normaliseerimine ja Kõnesüntees

Keelekorpus

Korpuseks nimetatakse lingvistikas valitud, digiteeritud ja teatud reeglite järgi töödeldud tekstide kogumit.

Vaata Teksti normaliseerimine ja Keelekorpus

Keelenorm

Keelenorm (lühikujul norm) on mingil ajal mingis keelekollektiivis objektiivselt eksisteerivad sõnade häälikehitus ja tähendused, sõnamoodustus- ja sõnamuutmismallid, süntaktiliste üksuste (sõnaühendite, lausete) mallid.

Vaata Teksti normaliseerimine ja Keelenorm

Keelenorming

Keelenorming (lühemalt ka norming) on keelenormi fikseering keelekorraldusallikais (nt "Õigekeelsussõnaraamatus").

Vaata Teksti normaliseerimine ja Keelenorming

Levenshteini kaugus

Levenhsteini kaugus on informatsiooniteoorias, keeleteaduses ja informaatikas algoritm, mida kasutatakse kahe sõne sarnasuse kirjeldamiseks.

Vaata Teksti normaliseerimine ja Levenshteini kaugus

Loomuliku keele töötlus

Loomuliku keele töötlus (Natural language processing, NLP) on arvutiteaduse, tehisintellekti ja arvutilingvistika ühisosa, mis keskendub inimese ja arvuti vahelisele suhtlusele.

Vaata Teksti normaliseerimine ja Loomuliku keele töötlus

Masintõlge

Masintõlge (ka automaattõlge, raaltõlgeTehnikaleksikon. Tallinn, Valgus, 1981. Lk 304) on arvutilingvistika haru, mis uurib võimalusi tõlkida tarkvara abil teksti või kõnet ühest loomulikust keelest teise.

Vaata Teksti normaliseerimine ja Masintõlge

Ortograafia

Ortograafia ehk õigekirjutus ehk õigekiri on reeglite süsteem, mille kohaselt kirjalikus keeletarvituses kasutatakse tähti, kirjavahemärke ja sõnavahesid.

Vaata Teksti normaliseerimine ja Ortograafia

Süntaks

Süntaks ehk lauseõpetus on grammatika osa, mis käsitleb sõnade ühendamist sõnaühenditeks ja lauseteks.

Vaata Teksti normaliseerimine ja Süntaks

Sõnaliik

Eesti keele sõnaliigid Sõnaliigid on keele sõnade klassid, mis ühendavad ühesuguste süntaktiliste, semantiliste ja morfoloogiliste omadustega sõnu.

Vaata Teksti normaliseerimine ja Sõnaliik

Sõnastik

Sõnastik on andmebaas, mis sisaldab tähestikulises järjestuses või muu reegli järgi järjestatud või elektroonselt otsitaval kujul sõnu või muid keelendeid ning nende tähendusi sõnaseletustena või tõlkevasteid.

Vaata Teksti normaliseerimine ja Sõnastik

Sõne (andmetüüp)

Sõne (ka string, inglise string) on andmetüüp programmeerimiskeeltes.

Vaata Teksti normaliseerimine ja Sõne (andmetüüp)

SMS

ladina kirja tarbeks Lühisõnum ehk SMS (lühend ingliskeelsest fraasist Short Message Service, 'lühisõnumiteenus') on tekstsõnumite saatmise teenus telefonidel, mobiilseadmetel või internetis.

Vaata Teksti normaliseerimine ja SMS

Tehisnärvivõrk

Tehisnärvivõrk on bioloogilise aju eeskujul ehitatud arvutuslik arhitektuur.

Vaata Teksti normaliseerimine ja Tehisnärvivõrk