„Apple“ teigia, kad mokydama „Apple Intelligence“ modelius laikėsi „atsakingo“ požiūrio

„Apple“ paskelbė techninį dokumentą, kuriame išsamiai aprašomi modeliai, kuriuos ji sukūrė, kad galėtų veikti „Apple Intelligence“ – generatyvių dirbtinio intelekto funkcijų asortimentas per ateinančius kelis mėnesius bus skirtas „iOS“, „MacOS“ ir „iPadOS“.

Straipsnyje „Apple“ atsisako prieš kaltinimus, kad kai kurių modelių mokymas buvo etiškai abejotinas, pakartodama, kad ji nenaudojo privačių naudotojų duomenų ir rėmėsi viešai prieinamų ir licencijuotų „Apple Intelligence“ duomenų deriniu.

“[The] išankstinio mokymo duomenų rinkinį sudaro… duomenys, kuriuos licencijavome iš leidėjų, kuruojami viešai prieinami arba atvirojo kodo duomenų rinkiniai ir viešai prieinama informacija, kurią tikrino mūsų žiniatinklio tikrinimo programa Applebot “, – rašo Apple. „Atsižvelgiant į tai, kad mes sutelkiame dėmesį į vartotojų privatumo apsaugą, pastebime, kad į duomenų mišinį neįtraukiami jokie privatūs Apple naudotojų duomenys.

Liepos mėnesį „Proof News“ pranešė, kad „Apple“ naudojo duomenų rinkinį „The Pile“, kuriame yra šimtų tūkstančių „YouTube“ vaizdo įrašų subtitrai, kad apmokytų modelių šeimą, skirtą apdoroti įrenginiuose. Daugelis „YouTube“ kūrėjų, kurių subtitrai buvo iššluoti „The Pile“, to nežinojo ir su tuo nesutiko; Vėliau „Apple“ paskelbė pareiškimą, kuriame teigiama, kad ji neketina naudoti tų modelių, kad galėtų naudoti savo gaminių dirbtinio intelekto funkcijas.

Techniniame dokumente, kuriame atitrauktos užuolaidos modeliams, kuriuos „Apple“ pirmą kartą atskleidė birželį WWDC 2024, pavadintame „Apple Foundation Models“ (AFM), pabrėžiama, kad AFM modelių mokymo duomenys buvo gauti „atsakingai“ arba už juos atsakinga „Apple“ apibrėžimas, bent jau.

AFM modelių mokymo duomenys apima viešai prieinamus žiniatinklio duomenis ir licencijuotus duomenis iš neatskleistų leidėjų. Anot „The New York Times“, 2023 m. pabaigoje „Apple“ susisiekė su keliais leidėjais, įskaitant NBC, „Condé Nast“ ir IAC, dėl daugiamečių sandorių, kurių vertė ne mažesnė nei 50 mln. USD, siekiant apmokyti modelius leidėjų naujienų archyvuose. „Apple“ AFM modeliai taip pat buvo mokomi atvirojo kodo, priglobto „GitHub“, ypač „Swift“, „Python“, C, „Objective-C“, C++, „JavaScript“, „Java“ ir „Go“ kodu.

Kodo modelių mokymas be leidimo, net atviro kodo, yra kūrėjų ginčų taškas. Kai kurie kūrėjai teigia, kad kai kurios atvirojo kodo kodų bazės nėra licencijuotos arba neleidžia mokytis dirbtinio intelekto pagal jų naudojimo sąlygas. Tačiau „Apple“ teigia, kad ji „filtravo“ kodą, siekdama įtraukti tik saugyklas su minimaliais naudojimo apribojimais, pvz., turinčias MIT, ISC arba Apache licenciją.

Siekdama pagerinti AFM modelių matematikos įgūdžius, Apple į mokymo rinkinį specialiai įtraukė matematikos klausimus ir atsakymus iš tinklalapių, matematikos forumų, tinklaraščių, vadovėlių ir seminarų. Bendrovė taip pat panaudojo „aukštos kokybės, viešai prieinamus“ duomenų rinkinius (kurių dokumentas neįvardija) su „licencijomis, leidžiančiomis naudoti mokymams… modelius“, filtruojamas, kad pašalintų neskelbtiną informaciją.

Apskritai, AFM modelių mokymo duomenų rinkinys sveria apie 6,3 trilijonus žetonų. (Žetonai yra nedidelio dydžio duomenų fragmentai, kuriuos generatyviems AI modeliams paprastai lengviau įsisavinti.) Palyginimui, tai yra mažiau nei pusė žetonų skaičiaus – 15 trilijonų – „Meta“ naudojo mokydama savo pavyzdinį teksto generavimo modelį „Llama 3.1 405B“. .

„Apple“ surinko papildomų duomenų, įskaitant duomenis iš žmonių atsiliepimų ir sintetinių duomenų, siekdama tiksliai suderinti AFM modelius ir bandyti sušvelninti bet kokį nepageidaujamą elgesį, pvz., toksiškumą.

„Mūsų modeliai buvo sukurti siekiant padėti naudotojams atlikti kasdienę veiklą „Apple“ produktuose
„Apple“ vertybėse ir kiekviename etape remiasi atsakingais dirbtinio intelekto principais“, – teigia bendrovė.

Popieriuje nėra rūkstančio ginklo ar šokiruojančių įžvalgų – ir tai yra dėl kruopštaus dizaino. Tokie dokumentai retai būna labai atskleidžiantys ne tik dėl konkurencinio spaudimo, bet ir dėl atskleidimo taip pat daug kas galėtų patekti į teisinių problemų turinčias įmones.

Kai kurios įmonės, mokančios modelius rinkdamos viešus žiniatinklio duomenis, tvirtina, kad jų praktika yra saugoma sąžiningo naudojimo doktrinos. Tačiau tai yra klausimas, dėl kurio kyla daug diskusijų ir daugėja ieškinių.

„Apple“ pažymi, kad ji leidžia žiniatinklio valdytojams užblokuoti tikrinimo programą, kad ji nenuskaitytų jų duomenų. Tačiau dėl to atskiri kūrėjai atsiduria nesėkmėje. Ką daryti menininkui, jei, pavyzdžiui, jo aplankas yra svetainėje, kuri atsisako blokuoti „Apple“ duomenų rinkimą?

Mūšiai teismo salėje nulems generatyvių dirbtinio intelekto modelių likimą ir jų mokymo būdą. Tačiau kol kas „Apple“ bando save pozicionuoti kaip etišką žaidėją, vengdama nepageidaujamo teisinio patikrinimo.

Source link