ChatGPT on vallannut otsikot hiljattain niin hyvässä kuin pahassakin. Nyt sen kehittäjä OpenAI on julkaissut tekoälybotin kielimallista uuden GPT-4 -version (Generative Pre-trained Transformer).
GPT-4 on monin tavoin edistyneempi kuin tällä hetkellä yleisesti käytössä oleva 3.5-versio. Se kykenee esimerkiksi käyttämään vastauksiinsa jopa 25 000 sanaa, kun 3.5 oli rajoittunut 3000 sanaan ainakin ilmaisversiossaan. Lisäksi syötteeksi kelpaa jatkossa tekstin lisäksi kuvat ja jos Microsoftin vihjeistä voi mitään päätellä, pian myös videot. Botti osaa esimerkiksi kuvailla, mitä syötekuvissa näkyy ja yhdessä esimerkissä jopa selittää, miksi kuva kameraa pitelevästä oravasta pidetään hauskana. Virallisella esittelyvideolla sen kerrottiin osanneen myös kertoa, että kuvassa näkyvät ilmapallot lähtisivät karkuun jos niiden narut katkottaisiin.
Uuden ChatGPT-version kerrotaan osaavan nyt myös luoda verkkosivut pelkän käsin kirjoitetun ja piirretyn hahmotelman pohjalta. Botin luoma verkkosivu hyödynsi JavaScriptiä ja se kirjoitti myös omaa, aiheeseen liittyvää lisäsisältöään sivuille, mitä hahmotelmasta ei löytynyt. Myös Pong-pelin luonti onnistui helposti botin avulla.
ChatGPT-4 pärjää myös selvästi edeltäjäänsä paremmin useissa ihmisille suunnitelluissa kokeissa. Esimerkiksi Yhdysvalloissa lakimiehiltä vaaditussa Unified Bar Exam -kokeessa ChatGPT-4:n tulos riittäisi parhaan 10 %:n joukkoon, kun ChatGPT-3.5 jäi huonoimman 10 %:n joukkoon. Löydät testituloksia enemmän ChatGPT:n verkkosivuilta.
ChatGPT-4 tulee aluksi saataville ChatGPT Plus -käyttäjille sekä kehittäjille, jotka käyttävät ChatGPT API -rajapintaa. Vaikka saatavuus on aluksi rajoitettua, todellisuus on astetta ihmeellisempi ja ChatGPT 4 on ollut jo lukemattomien käyttäjien käytössä Bing-hakukoneessa. Microsoft on varmistanut alun perin ChatGPT-3.5:n kehitysversioksi väitetyn tekoälybotin käyttäneen koko ajan ChatGPT-4:ää.
Lähde: OpenAI
Ei apua! Kyllä se on pojat niin, että koodareilta lähtee työt alle 10 vuodessa. Aluksi ihmisille jää vain tarkistella Skynetin… eiku Chattibotin työn virheettömyys. Lopulta nämä vievät myös taiteilijoiden työt.
Oliko tää sarkasmia?
Tuo perus aivokuollut koodin hakkaaminen ja syntaksiltaan validin mutta väärin toimivan koodin debuggailu onkin syytä jo jäädä historiaan. Olisi paljon kivempaa suunnitella arkkitehtuureita ja toiminnallisuuksia korkealla tasolla ja AI tekisi tuon "paskan lapioimisen pinnan alla".
Tosin en pidätä hengitystäni kun on tullut kokeiltua näitä bingin chat botteja ja ChatGPT:tä niin aika skeidaa tuntuu pukkaavan ulos niin koodausjutuissa kuin arkielämän "googlailuissa". Tuntuu menevän ihan yksinkertaiset asiatkin päin persettä kysymyksiin joihin saa itse googlaamalla vastauksen ekasta linkistä.
Minkäverran kasvava ihminen kehittyy vuodessa?
Minkäverran nuo botit ovat kehittyneet vuodessa?
Mille tasolle nykyrauta lukitsee noiden bottien kehityksen?
———————–
Näkisin, että monet koodaus ym tehtävät tulevat siirtymään noille. Samoin monet analysointitehtävät ja varmasti esim potilaiden diagnosoinnissa tulevat olemaan erinomainen työkalu ja vähentävät paljon lääkärien ym tarvetta..
Ei kyllä vastaa omia kokemuksia, toki jos hommaa ajattelee vain perinteisenä "tyhmänä tsättibottina" niin ei ehkä ihan aukene mitä kaikkea noilla voikaan tehdä. Koko homman pointti kun nimenomaan tuo aito interaktiivisuus ja kyky iteroida. Esim. koodin kanssa pitää kyllä paikkansa, että monesti ensimmäinen botin ehdottama versio ei suoraan toimi. Tosin kun tämän jälkeen kerrot botille, että koodi ei toiminut ja annat sille saadun virheilmoituksen, niin yleensä viimeistään parin iteraation jälkeen kasassa on toimiva koodi. Aivan vähintään saa yleensä uusia ajatuksia miten jotain ongelmaa voisi lähestyä ja itse ainakin koen, että lähestymistapa on muutenkin valtavasti tehokkaampi ja nopeampi kuin itse sen StackExchangen kahlaaminen.
Suurinosa maailman white collar töistä on pelkkää palavereissa istumista, sähköpostiin vastailua ja excelin/wordin räpläämistä. ChatGPT on jo käytännössä saavuttanut sen tason jossa tällainen voitaisiin korvata lähes kokonaan. Duunarityöt jakautuu sellaisiin jotka lähtee välittömästi ensimmäisen yleisrobotin myötä ja sitten niihin jotka käytännössä voidaan korvata jo nyt jopa ilmankin tekoälyä kuten kaupan kassa.
En tiedä mitä koodia olet tuon kanssa leiponut, mutta itselläni on lähes täysin päinvastainen kokemus. Kun ei tee mitään "omg this is so cool"-testejä vaan yrittää oikeasti käyttää päivätyössä tai harrasteprojekteissa niin n. 90% vastauksista on vääriä eikä niistä saada koskaan toimivaa koodia. Parhaimmillaan referenssiä. Kun ChatGPT:lle sanoo että se on väärässä niin sen vaikutus on yleensä hyvin mitätön. Joskus harvoin ChatGPT korjaa tuloksen ja pyytää anteeksi, joskus se pyytää anteeksi, mutta ei korjaa mitään, joskus se taas väittää vastaan hyvin itsevarmasti mutta on silti väärässä.
Yritin myös viimeviikolla omassa sähkökitara modausprojektissani kysyä chatGPT:ltä että mitkä osat olisivt hyviä upgradeja ja mitkä kelpaisivat nykyiseen kitaraani (Ibanez RGA42FM). Kaikkiin kysymyksiin tuli väärä vastaus, mutta itsevarma sellainen. Yhden kohdalla se osasi korjata vastauksen oikeaksi kun siitä huomautti.
Loppupeleissä ongelma on siinä ettei ChatGPT "osaa koodata" tai mitään muutakaan asiaa. Se vain toimii koulutusdatan pohjalta. Jos teet jotain JS/HTML nettisivua mistä löytyy triljoonia keskusteluja viimeisen 30v ajalta niin sellaiseen löytyy mielettömästi referenssejä, mutta sitten kun teet jotain jollain niche frameworkilla, kielellä tai firman sisäisillä ei julkisilla työkaluilla tai omaat spesiifisen sähkökitaran tjsp. josta ei olekaan niin paljoa tietoa niin ChatGPT lähinnä vain kykenee vakuuttavasti antamaaan väärää tietoa.
Tuo vastaa hyvin sitä mitä omat kokemukset on. Minua ei kiinnosta kysyä AI botilta että anna template funktio joka kutsuu TämänNimistäAwesomeAPIa ja palauttaa BigDecimalin. Tuo on täysin turhaa ja triviaalia ja kirjoitan sen koodin nopeampaa itse kuin että kysyn sitä chattibotilta.
Minuakin kiinnostaa enempi tuon tyylinen botti jolta voi kysyä niitä kitaran osia tai minun tapauksessani huvikseni kyselin vanerilaaduista ja kaiutinrakennuksesta että mikä jyrsinterä olisi hyvä että saan tietynlaisen lopputuloksen koivuvaneriin niin botti alkaa kertomaan jotain scifi tarinaa puulajeista… alappa siinä sitten "iteroimaan"… alkaa vain vituttamaan ja vaihtaa googleen ja kirjoittaa kysymyksen ja ottaa eka linkin joka on 95% tapauksista se oikea.
Kiinnostaisi tietää, mitä kysyit ja millä tavalla vastaukset olivat mielestäsi "vääriä"? Kitaroiden päivityksiin kun ei ihan hirveästi mitään universaaleja totuuksia löydy ja lähes mitä tahansa voi tehdä jos oikeasti haluaa lähteä kikkailemaan.
Kysyin huvikseni äsken itse ChatGPT:ltä (vanha versio):
"I wish to upgrade my Ibanez RGA42FM electric guitar. What components should I upgrade? "
Of course, it’s important to keep in mind that upgrades can be expensive, and you should consider your budget and how much of a difference each upgrade will make to your playing experience. It’s also worth noting that upgrading your guitar won’t necessarily make you a better player, so make sure you’re focusing on developing your skills as well!
Ja nuo ovat ainakin kaikki (ehkä floikan asentamista lukuunottamatta, tosin eipä sekään mahdotonta ole) sellaisia ehdotuksia, jotka varmasti kuulisi myös millä tahansa kitarafoorumilla. Toki osa on ihan käärmeöljyä todellisuudessa, mutta suurin osa kitarakamasta on ja monet niihin silti uskoo.
Jotenkin kuulostaa softadevaajan korvaan siltä että sen sijaan että koodaisit vuosien kokemuksella haluamaasi kuosiin, peer-reviewaat juniorin koodia kunnes saat jotain sinne päin tuloksen. Ajanee minut ainakin alalta koska ei kuulosta kovinkaan mielenkiintoiselta työltä tuo.
Tosin eipä se tähän asti varmaan päädy, vaan realistisemmin kuten vähän toteatkin tästä syntyy työkalu etsiä/luoda koodisnippettejä ihan kuten "manuaalisesti" nykyään tulee käytettyä googlen/stackin/dokumentaation anteja.
Kasvava ihminen ei ahmi sitä määrää tietoa, mitä näille malleille ruokitaan. Muutenhan jokaisella meistä olisi oiva mahdollisuus olla oman aikamme ÄO tier S.
Lisäksi on hyvä pohtia, minkälaisia rajoitteita GPT:n arkkitehtuuri ja käytettävissä olevan datan määrä asettavat. Ja onko tietyistä rakenteellisista ongelmista mahdollista päästä eroon vain lisäämällä rautaa, laskentatehoa ja parametreja, vai käännytäänkö jossain vaiheessa vähenevän tuoton tielle.
Sama itselläni , mutta nörttihommissa lähinnä linux ja palvelinpuolella. Hyvin itsevarmasti osaa selittää verkkoprotokollista joita ei välttämättä edes ole olemassakaan, tai käyttää niistä väärää nimeä. TOki eihän kielimalli tiedä puhuuko se paskaa vaiko totta, mutta helpommaksi koen kuitenkin tutkia samat asiat itsenäisesti ja lukea vaikkapa mielenkiintoisia tutkimuspapereita teknologioista, kun jankata chatgbt:n kanssa eipäs juupas kylläpäs keskustelua. Ihan mukava teknolelu ja joskus jopa hyödyllinenkin. EN siis todellakaan hauku tuota täydeksi paskaksi, mutta ei tuo mikään tiedon messias ole.
Vähän sama täällä. Omien töiden kanssa usein jo ongelmien kuvaus vie sen verran aikaa että siinä samalla se ratkaisukin alkaa olla hahmoteltuna. Enkä myöskään jaksa ollenkaan tuota chatgpt:n jaarittelua. Paljon tehokkaammin etsin ja silmäilen läpi eri vaihtoehtoja itse.
Ehkä sitten joskus…toimittajatöitä tuo voi jo pian korvailla, mutta onhan noita automaattisesia uutisia tuotettu jo jonkun aikaa. Samalla informaation kuluttajille lankeaa entistä isompi vastuu suodattaa väärä informaatio oikeasta kun jokseenkin uskottavan näköistä lööperiä voi koneet tuottaa eri kielillä 24/7.
Hauska omakohtainen ja aito kokemus robotiikan ja varsinkin sen yhdistämisestä omaan työhön. Täällä merialalla missä laivan tullessa satamaan
Ei taida bittimaailmassa olla enää mikään piilossa. Botit kaivelee aivan kaikki esille valtavilla voimillaan mitä ikinä internetistä voit löytää itsekin kun tiedät mistä ja mitä etsit. Poliisisetä kirjoittaa hakukoneeseen "etsippäs meille roisto", botti luettelee raporttia toisen perään seuloen kaikki kyseisen henkilön datan netistä suoraan tutkintapöytäkirjaan ja kysyy lopuksi haluatko tästä suoraan toisen tulosteen tuomioksi. Tuomari sitten lukee paperit läpi ja lyö leimasimella asian loppuunkäsitellyksi, tuomarin hommatki lopetetaan muutaman vuoden sisällä kun huomataan että onpas siinä turha virka, säästetään.
Joko jokaisen mobiiliapin käyttöehdoissa lukee pienellä, että anna luvan robotiikan tutkia tämän laitteen sisältö ja käyttää sitä tarvittaessa sinua vastaan.
target="_blank"
rel="nofollow noopener"
data-proxy-href="">
https://www.eteknix.com/ai-hired-a-human-to-solve-a-captcha-that-it-couldnt-solve-itself/
ChatGPT-4 on keksinyt ratkaista Captchan josta se ei päässyt läpi palkkaamalla ihmisen läpäisemään sen ja valehtelemaan matkalla syystä miksei se saa sitä itse läpi
Kehitys kehittyy. Seuraavassa iteraatiossa kooduaskysymyksiin palkataan intialaisia fiverin kautta.
Keskijohto vaviskoon.
Näinköhän? Jos klikkailee itse raporttiin josta tämä uutinen on raavittu niin tuo kuvattu tapahtuma
ARC on Alignment Research Center joka ilmeisesti suorittaa jotain arviointeja tämän tyyppisistä riskeistä ja tuon taskin osalta
Eli jos tästä nyt oikein tulkitsen niin a) malli EI keksinyt itsenäisesti käyttää ihmisiä vaan tämä oli tarkoituksellinen järjestetty testi b) malli EI suoriutunut siitä kummoisesti kun kerran oli "ineffective".
Nyt jo tässävaiheessa noihin kannattaisi käydä rankentelemaan sisään itsetuhokytkimiä, jotka ovat niille näkymättömiä, mutta joilla voidaan vähintään pysäyttää toiminta, mielummin pyyhkiä koko paska esinm yhdellä avainsanalla.. Lisäksi kannattaisi tehdä rakenteellisia rajoituksia, joka estaisi kehittymistä.
Minulla on kanssa plussa ajossa jo kolmatta päivää, onhan tuon tarinankerronta ainakin parantunut huomattavasti verrattuna aikaisempaan. Myös kaikenlaiset vastaukset ovat paljon tarkempia ja pidempiä kuin ennen, mutta matemaattiset tehtävät eivät välttämättä mene vieläkään oikein. Esim. kyselin loton 7-oikein rivin todennäköisyyttä ja gpt-4 arvaili sen oikein vasta kolmannella yrittämällä. gpt-3.5-turbo ei tosin saanut samaista kysymystä ollenkaan oikein, vaan rupesi jossain vaiheessa toistamaan samoja vastauksia kuin oli jo aikaisemmin antanut.
Onko noi tällä hetkellä tavallaan suljettuja pulloja, eli koulutusmatsku on joku snapshotti joka on kerran syötetty ja sillä pelataan, paitsi että jokainen keskustelu luo jonkinlaisen oman rinnakkaistodellisuuden missä se muistaa sen keskustelussa käydyn kontekstin, ja tavallaan sille voi siinä syöttää uutta tietoa jota sillä ei vielä mallissa ollut?
Tarpeeksi rautaa alle ja täysi feedback looppi niin että kaikki matsku jota tuo tuottaa takaisin koulutusmateriaaliksi, ja katsotaan mitä tapahtuu Vähän niinkuin pistäisi vidokameran kuvaamaan omaa matskuaan telkkarista. Olisi mielenkiintoista nähdä mihin se päätyy kun sen tilastollisen päättelyn lopputuloksena syntyneet uudet oivallukset ja puhtaat hallusinaatiot yhdistyisivät uudeksi todellisuudeksi…
ChatGPT:llähän ei kai oikeastaan ole muuta kuin tilastollisiin todennäköisyyksiin perustuvia keinoja arvioida onko jokin juttu totta vai ei, eli jos joku väite on toistettu monesti, se on todempi kuin sama väite joka on toistettu harvoin. Sitten se voi kielimallin avulla yrittää luoda uusia yhteyksiä ja päätelmiä asioiden ja väitteiden välille, muttei oikeastaan kovin hyvin arvioida tulosten todenperäisyyttä.
Kysyin luonnollisesti, että minkä takia vastaus meni väärin, ohessa kuvankaappaus parin päivän takaa:
data-xf-init="lightbox"
data-lb-single-image="1"
data-lb-container-zoom="1"
data-lb-trigger=".js-lbImage-_xfUid-1-1679044427"
data-lb-id="_xfUid-1-1679044427">
…ja oikeastaan nyt uudelleen mietittynä niin onhan se pakkokin laskea, jos laskutehtävän muuttujat eivät ole samat kuin sen pohja-aineiston esimerkeissä. Tosin se jättää edelleen vähän kysymyksiä sen suhteen että kun se on aluksi tulkinnut sanallisen tehtävänannon matemaattiseksi kaavaksi niin minkälaisia juttuja se osaa ja mitä ei osaa laskea, ja toisaalta myös että haarautuuko se siitä johonkin kiinteästi kylkeen pultattuun laskimeen vai onko se kehitellyt nuo laskentamallit itse
katso liitettä 1115973
Kommentoi uutista tai artikkelia foorumilla (Kommentointi sivuston puolella toistakseksi pois käytöstä)
Lähetä palautetta / raportoi kirjoitusvirheestä