Logo lt.nowadaytechnol.com

Trys Nauji NAUDOTI Daugiakalbiai Moduliai Ateina į „TensorFlow“

Turinys:

Trys Nauji NAUDOTI Daugiakalbiai Moduliai Ateina į „TensorFlow“
Trys Nauji NAUDOTI Daugiakalbiai Moduliai Ateina į „TensorFlow“

Video: Trys Nauji NAUDOTI Daugiakalbiai Moduliai Ateina į „TensorFlow“

Video: Trys Nauji NAUDOTI Daugiakalbiai Moduliai Ateina į „TensorFlow“
Video: Настя и папа нашли подарки к Хэлоуин 2024, Kovas
Anonim
Image
Image

„Google“yra viena iš dirbtinio intelekto tyrimų pradininkų, ir daugelis jų projektų suko galvą. „AlfaZero“iš „Google“ „DeepMind“ komanda buvo perversmas dirbtinio intelekto tyrimuose dėl programos gebėjimo savarankiškai išmokti sudėtingų žaidimų (be žmogaus mokymo ir intervencijos). „Google“taip pat puikiai dirbo Natūralios kalbos apdorojimo programos (NLP), o tai yra viena iš „Google“padėjėjo efektyvumo suprantant ir apdorojant žmogaus kalbą priežasčių.

„Google“neseniai paskelbė išleidusi tris naujus NAUDOKITE daugiakalbius modulius pateikti daugiau daugiakalbių modelių semantiškai panašiam tekstui gauti.

Pirmieji du moduliai pateikia daugiakalbius modelius, skirtus semantiškai panašiam tekstui gauti, vienas optimizuotas paieškos rezultatams, kitas - greičiui ir mažiau atminties naudojimui. Trečiasis modelis yra specializuotas klausimo-atsakymo paieškai šešiolika kalbų (USE-QA) ir reiškia visiškai naują USE taikymą. Visi trys daugiakalbiai moduliai yra mokomi naudojant daugiafunkcį dvigubo kodavimo sistemą, panašią į originalų USE modelį anglų kalbai, o naudojant metodus, kuriuos sukūrėme patobulinę dvigubą kodavimo įrenginį, naudodami „addmax margin softmax“metodą. Jie skirti ne tik palaikyti gerus perkėlimo mokymosi rezultatus, bet ir gerai atlikti semantines paieškos užduotis.

Kalbos apdorojimas sistemose nuėjo ilgą kelią - nuo pagrindinės sintaksės medžio analizės iki didelių vektorių asociacijos modelių. Konteksto supratimas tekste yra viena didžiausių problemų NLP lauke, o „Universal Sentence Encoder“tai išsprendžia konvertuodamas tekstą aukštų matmenų vektoriuose, o tai palengvina teksto reitingavimą ir žymėjimą.

Image
Image

Pasak „Google“, „ Visi trys nauji moduliai yra pagrįsti semantinės paieškos architektūra, kuri paprastai padalina klausimų ir atsakymų kodavimą į atskirus neuroninius tinklus, o tai leidžia ieškoti milijardų galimų atsakymų per milisekundes. Kitaip tariant, tai padeda geriau indeksuoti duomenis.

Visi trys daugiakalbiai moduliai yra mokomi naudojant daugiafunkcį dvigubo kodavimo sistemą, panašią į originalų USE modelį anglų kalbai, o naudojant technologijas, kurias mes sukūrėme patobulinti dvigubą kodavimo įrenginį su papildomosios maržos programine sistema. Jie skirti ne tik palaikyti gerus perkėlimo mokymosi rezultatus, bet ir gerai atlikti semantines paieškos užduotis. “Funkcija „Softmax“dažnai naudojama skaičiavimo galiai taupyti, eksponuojant vektorius ir paskui padalijant kiekvieną elementą iš eksponento sumos.

Semantinė paieškos architektūra

„Visi trys nauji moduliai yra sukurti remiantis semantinėmis paieškos architektūromis, kurios paprastai klausimų ir atsakymų kodavimą suskirsto į atskirus neuroninius tinklus, o tai leidžia ieškoti milijardų galimų atsakymų per milisekundes. Raktas norint naudoti dvigubus koduotojus efektyviam semantiniam paieškai yra iš anksto užkoduoti visus kandidatų atsakymus į laukiamas įvesties užklausas ir išsaugoti juos vektorinėje duomenų bazėje, kuri yra optimizuota artimiausio kaimyno problemai išspręsti, o tai leidžia greitai ieškoti daug kandidatų ir gerai tikslumas ir atšaukimas “

Šiuos modulius galite atsisiųsti iš „TensorFlow Hub“. Daugiau informacijos skaitykite „GoogleAI“tinklaraštyje.

Rekomenduojamas: