Transkrypcje

TRANSKRYPCJA VIDEO

PJATK

ODC. 2 - DOMINIKA WNUK - Programista w pracy

Opis wygenerowany przez Skrybot

Dla tego filmu nie wygenerowano opisu.

Transkrypcja wygenerowana przez Skrybot

Cześć. Słuchasz podcastu na początek, stworzonego przez Polsko-Japońską Akademię Technik Komputerowych. Zapraszam, Kinga Rudas. Studie informatyczne drugiego stopnia niosą ze sobą etapy napisania pracy. Właśnie, jak będziemy kończyć te studia? Praca ogólnie magisterska już w założeniu jest o wiele bardziej skupiana na teorii i na badaniach niż praca inżynierska. Na inżynierskich jednak skupiamy się na stworzeniu czegoś takiego bardziej, w cudzysłowie oczywiście namacalnego, czy jakiegoś chociażby programu, programowania jakiejś gry. Na studiach magisterskich ten etap też jest ważny, ale praca jest o wiele bardziej naukowa sama w sobie. Tak że w moim przypadku ja na przykład analizowałam metody, które pozwalały na ulepszenie tłumaczenia maszynowego poprzez po prostu dodatkowe techniki.

Więc tutaj etap jeden polegał na zebraniu danych, drugi na eksperymentach, ale tak naprawdę cała praca potem się skupiła na tym, żeby opisać to, co wyszło, to, co nie wyszło, jak można by zmienić, żeby było lepiej, jak można by to rozwijać dalej. Tak że idziemy tutaj bardziej też taką analizę tematu, nie tylko sam program w sobie. On nie jest tym punktem końcowym, ale właśnie ta analiza, czyli dowiedzenie na przykład jakiejś też, w moim przypadku na przykład implikacji biznesowych ze stworzenia takiego programu. W moim przypadku też ja akurat miałam wcześniej doświadczenie z agencjami tłumaczeniowymi, tak że mogłam pokazać tak bardzo namacalnie po prostu na finansach, jak się przekłada taki program na faktyczne zyski dla firmy i potencjalne oszczędności.

Tak że tutaj właśnie ten element takiego zanalizowania tematu jest ważny i tutaj ja też prowadzę akurat prace magisterskie, więc może nie będę za bardzo wchodzić w szczegóły, bo nie wiem, na ile mogę sobie pozwolić też, żeby studenci może nie mieli do mnie jakiś uwag, że tutaj opowiadam za dużo o ich pracach, póki nie są publikowane, ale chociażby bardzo popularnym zagadnieniem w ostatnich latach jest tak zwana analiza wydźwięku po angielsku sentiment analysis, która pozwala chociażby na filtry, tak jak w social mediach pojawiają się różne komunikacje, osoby piszą różne rzeczy i na przykład chcemy odfiltrowywać takie teksty, które chociażby kogoś mogą zranić czy są bardzo wulgarne, więc analiza wydźwięku właśnie pozwala zanalizować treść, czyli zastanowić się czy na przykład ten komunikat jest nacechowany pozytywnie, czy właśnie negatywnie.

Ma ono wiele szersze zastosowanie, ale chociażby jedna praca, która u mnie powstaje, dotyczy właśnie tego zagadnienia i dla języka polskiego, ponieważ wciąż jednak uchodzimy za język niszowy, takich rozwiązań jest mniej, ale dzięki temu my mamy o wiele większe pole do popisu, żeby pokazać coś właśnie dla języków z taką specyfiką języków niszowych, gdzie i danych jest mniej, i gramatyka, i kwestie fonetyczne, czyli dźwiękowe są o wiele bardziej skomplikowane, także mamy też szanse potem na rynku się pokazać jako osoby, które o wiele głębiej weszły w te analizy, bo nie sztuką już dzisiaj z analizy języka angielskiego, ale takie właśnie języki niszowe chociażby są tutaj świetnym przykładem.

Albo inna praca, która z kolei poszła w stronę data miningu, czyli pozyskiwania danych i potem takiej głębokiej analizy, dotyczy na przykład rynku nieruchomości. Także tutaj, tak jak mówiłam, bardzo różne branże możemy łączyć właśnie z tym klasycznym programowaniem. Proszę jeszcze powiedzieć, kończąc ten wątek, czy ma pani publikacje, filmy, jakieś szkolenia ulubione, które poleciłaby pani osobom zaczynającym swoje szkolenie w programowaniu? Tak, wracając do statystyki, która wiem, że przeraża, i myślę, że trochę ja tak nie w porządku, że się cieszę taką złą famą, bo ja osobiście uważam, że statystyka jest naprawdę potrzebna i o wiele bardziej obecna w naszym życiu niż jesteśmy tego świadomi. Natomiast jeżeli chodzi o kanał ze statystyki na YouTubie, to zdecydowanie polecam kanał, który się nazywa StatQuest.

To jest akurat kanał prowadzony w języku angielskim, ale filmiki są opatrzone grafiką, są tłumaczone w taki bardzo obrazowy sposób, że nawet osoby, które wcześniej tej statystyki nie miały, mogą przynajmniej zrozumieć koncepcje, a potem najwyżej ściągnąć do bardziej zaawansowanych czy książek ze statystyki, czy innych źródeł i materiałów i po prostu tę wiedzę pogłębić. Ale to jest naprawdę świetny początek. Poza tym, jeżeli chodzi o uczenie maszynowe, to jest moja działka, także z tego będę polecać. Jest na YouTubie też dostępny kurs Jeremiego Howarda. On właśnie robi takie wprowadzenie do uczenia maszynowego. To już jest o wiele bardziej programistyczne, także tutaj warto jednak wcześniej troszeczkę się przygotować z tego programowania w Pythonie.

Natomiast on bardzo dokładnie i tak powoli tłumaczy właśnie różne zagadnienia z tego podstawowego uczenia maszynowego, a kolejnym etapem już potem takie pogłębienie to byłby taki badacz Andrew Ng, bardzo znany właśnie z uczenia maszynowego, takiego głębokiego, czyli tych, może państwo już wcześniej słyszeli, głębokich sieci neuronowych. On prowadzi kursy na Corsairze, to jest taka platforma płatna, natomiast też wiele jego filmów jest dostępnych bezpłatnie na YouTubie, więc tutaj do pewno to polecam. A jeżeli chodzi o samoprogramowanie, to tu akurat konkretnych kanałów nie mam, ale myślę, że jak po prostu sobie wpiszemy, czy w języku polskim, czy w angielskim, programowanie w Pythonie, to znajdziemy bardzo dużo sensownych materiałów.

Ewentualnie zapraszam na studia do mnie na zajęcia, no to też państwu po prostu wtedy udostępnię moje materiały, także tutaj, jeżeli chodzi o polecajki, to to właśnie te kanały. Po studiach czas na pracę, przejdźmy do tego ogromnego tematu. Umiemy programować. Co dalej? Gdzie mogę iść? Gdzie pracować? Z programowaniem, jeżeli nie mam jakiegoś doświadczenia, to najpierw oczywiście warto pomyśleć o praktykach, ale tutaj biuro karier akademickie prężnie działa, także to tutaj odsyłam i polecam. Sama też współpracowałam z biurem karier, chociażby tworząc swoje CV, właśnie żeby się lepiej przygotować na rynek pracy i żeby wiedzieć, czego i oczekują pracodawcy i po prostu, jak się lepiej zaprezentować, także bardzo też polecam z własnego doświadczenia.

Natomiast, jeżeli chodzi o już ścieżki potencjalne zawodowe, jakie tutaj moglibyśmy wybrać, akurat w tej dziedzinie, w której ja się specjalizuję, tutaj ścieżek jest kilka, możemy wybrać albo analizę danych i zostać tak zwanym data analystem. Tutaj te granice pomiędzy data analystem, data scientistem i data engineerem są takie dosyć płynne, bo też firmy ogłaszając różne stanowiska pracy, czasami piszą jedno, a szukają zupełnie czegoś innego, więc większą, jakby lepsze informacje zdobędziemy patrząc na wymagania i opis stanowiska pracy niż być może po samym tytule. Natomiast tak, możemy być data analystem, czyli po prostu klasyczna analiza danych, jakieś tworzenie właśnie dashboardów, wyciąganie wniosków. Data scientist, który jest takim, można powiedzieć, trochę rozszerzeniem tego data analista, ale jeszcze jest bardziej techniczny, także też właśnie dodatkowe technologie.

Data engineer, pracujemy znowu też z danymi, ale to na przykład może być pozyskiwanie danych, czyszczenie, czyli możemy jako ten inżynier danych współpracować z data scientistem, my mu przygotowujemy dane, a on potem bierze te dane i robi z nimi coś więcej, chociażby analizuje albo tworzy jakieś proste modele statystyczne. Możemy też pójść w taką już tą ścieżkę bardzo, bardzo tak zwanej sztucznej inteligencji, chociaż nie przepadam z tym terminem, ale jest. Czemu? Czemu nie? Sztuczna inteligencja cały czas jeszcze aż taka inteligentna nie jest. Znaczy jest coraz lepsza i tutaj w sumie też ciekawe badania, ale może o tym za chwilę, natomiast tak osobiście uważam, że jeszcze trochę za wcześnie, żeby mówić o sztucznej inteligencji. To są programy inteligentne, wolę tak o tym mówić.

Możemy zostać inżynierem albo uczenia maszynowego, albo tak jak w moim przypadku inżynierem przetwarzania języka naturalnego i wtedy już budujemy modele, łączymy w sobie troszeczkę właśnie z tej analizy danych, z inżynierii danych, ale też i inżynierii oprogramowania, więc jest to taki bardziej zbiorczy i zaawansowany już zawód. Żeby zostać tym inżynierem czy uczenia maszynowego, czy przetwarzania języka, to nie jest taka prosta ścieżka. Łatwiej jest zacząć jednak od po prostu pracy programisty, chociażby programista Pajtona jest dobrym początkiem. O wiele łatwiej jest jednak już z tym doświadczeniem wejść w tej branży, bo tutaj wymagania są naprawdę wysokie. Jeszcze niedawno często nawet wymagany był doktorat w tej dziedzinie.

Teraz już się to zmienia i doświadczenie takie zawodowe jest na równi traktowane z doktoratem, także już nie ma tego wymogu, ale niemniej cały czas próg jest wysoki i chociaż chętnych nie brakuje, to jednak z drugiej strony jest to już bardziej zaawansowany zawód, więc warto po prostu na to zwrócić uwagę, żeby być świadomym. Może lepiej na początek właśnie programista Pajtona zdobyć to doświadczenie po prostu w regularnym programowaniu takiej pracy już w zawodzie, a potem najwyżej po prostu albo w obrębie jednej firmy, albo do nowej firmy po prostu startować na nowe stanowisko. Także myślę, że jako ten, jeżeli chcemy mieć programowanie, to taki właśnie najpierw programista.

Jeżeli bardziej jednak interesuje nas analiza danych, no to albo, tak jak mówiłam, analitek danych, albo data scientist, tutaj nie ma polskiego na razie terminu na to, albo inżynier danych także w te strony. To, co łączy te wszystkie trzy drogi, to jest praca z danymi.

W każdej z tych prac spotkamy się z danymi, tylko że na tych stanowiskach typu data scientist, data engineer czy data analyst, to będzie jednak analiza i ewentualnie zebranie, czyszczenie danych i raczej na tym pozostaniemy, a ten inżynier uczenia maszynowego czy przetwarzania języka naturalnego, to on też może pozyskiwać te dane, ale ważniejszy będzie ten proces już dalej, później, czyli jak już właśnie na przykład ten inżynier danych zebrał nam jakiś zbiór, to my dalej ten zbiór wykorzystujemy, żeby wyciągnąć wpierw jakieś wnioski, może jakąś hipotezę postawić, ale też nie zawsze będzie tak, że jak mamy dane i postawimy hipotezę, to my potem te dane faktycznie wrzucimy do jakiegoś modelu uczenia maszynowego.

Może się okazać, że problem, który postawiliśmy jest na tyle prosty, że wystarczy po prostu prosty model statystyczny do rozwiązania takiego problemu, więc tutaj przy tym uczeniu maszynowym pojawia się ten moment takiej analizy biznesowej, gdzie patrząc w dane, staramy się też dojść do tego, czy te dane mogą nam pozwolić na jakąś automatyzację i czy faktycznie taki model uczenia maszynowego pomógłby nam dojść do rezultatów w o wiele efektywniejszy i szybszy sposób i może na przykład o wiele taki bardziej dokładny niż prosty model statystyczny albo może właśnie jest to taka relacja bardzo prosta, gdzie nie ma potrzeby wykorzystywania tak zaawansowanych modeli. Także ta analiza na pewno tutaj się pojawia, jest czymś, co łączy te wszystkie zawody.

A jak będzie wyglądać rekrutacja? Czy tak jak pani wcześniej wspominała, będzie konieczne to portfolio i będzie to wyglądać właśnie tak jak pani wspominała, że będziemy tłumaczyć swój tok myślenia? Tu też zależy dużo od firmy, do jakiej startujemy. W startupach jest przeważnie tak, że jednak jest taki kilkuetapowy proces i często właśnie pojawia się czy to wymóg portfolio, czy na przykład są serwisy typu HackerLang, GlidCode, gdzie są zadania programistyczne, które trzeba w odpowiedni sposób rozwiązać i potem taki rekruter analizuje to, co napisaliśmy w oparciu o rozwiązanie. Nie zawsze jest tak, że jest jedno dobre rozwiązanie, tylko też często ważny jest ten tok myślenia, który nam towarzyszył.

Natomiast jeżeli startujemy do takich dużych firm typu Meta, Twitter, Google i tak dalej, to etap też często właśnie jest ten kilkuetapowy proces rekrutacji. Te etapy mogą być jakby skrócone albo wydłużone, chociaż też powiem państwu, że jeżeli jest więcej niż 5 etapów, to w ogóle nie warto aplikować, bo to wygląda podejrzanie po prostu i raczej można pomyśleć, że nie traktują wtedy poważnie osoby kandydującej, bo jednak poświęcić tyle czasu na rekrutację to też jest dosyć kłopotliwe.

Natomiast zawsze się pojawia właśnie ten etap sprawdzenia kodu, czyli czy to będzie taki test, że na przykład mamy jakiś limit czasowy, powiedzmy 20 minut na zadanie i musimy to zadanie rozwiązać albo z rekruterem, który na bieżąco patrzy, co robimy i jeszcze co więcej musimy pisząc ten kod tłumaczyć nasz tok myślenia na żywo, co może być dosyć stresujące, dlatego warto to ćwiczyć. Albo są tak zwane take-home assignments, czyli na przykład dostajemy zlecenie, jakiś taki mały projekcik, który mamy wykonać i powiedzmy dostajemy np. dobę na wykonanie, a potem wysyłamy takie zlecenie z powrotem i dostajemy feedback.

Są też etapy, gdzie będziemy opowiadali o naszym doświadczeniu albo jeżeli jesteśmy właśnie świeżo upieczonymi absolwentami, to też niektóre firmy pozwalają na to, żeby nie było tego doświadczenia, tylko biorą jak najbardziej juniorów i potem po prostu już dokształcają w swoim zakresie jakby pod swoją branżę, więc tutaj ten etap może być doświadczeniem albo nie, ewentualnie opowiedzenie o tego, co było na studiach, chociaż też jeżeli w CV w miarę już opiszymy te technologie, które chociażby zgłębiliśmy, to też nie musimy się spodziewać, że zostaniemy od razu odrzuceni.

Warto tylko tworząc takie CV, to tak na marginesie dodam, jeżeli nawet projekt powstawał tylko w ramach studiów, to wspomnieć właśnie czego dotyczył projekt, jaki był cel, jakie technologie zostały wykorzystane, bo potem osoba analizująca takie CV też ma lepszy obraz tego, co faktycznie robiliśmy w ramach studiów, bo napisanie, że mieliśmy zajęcia z programowania jest bardzo ogólne i mało nam mówi, co faktycznie się działo, czyli jaki był język, jakie technologie, jakie problemy, także tutaj warto się na tym zastanowić i też przy tych dużych firmach niestety jest tak, że często nasze CV są czytane przez algorytmy, a nie przez prawdziwych ludzi, więc jeżeli nie trafimy w te słowa klucze, czyli nie zawrzemy wszystkich tych technologii, tylko po prostu napiszemy bardziej opisowo, to możemy zostać odrzuceni właśnie przez to, że zapomnieliśmy po prostu podać tych słów, które są kluczowe do danej pracy.

I jeszcze z takich etapów rekrutacji to, jeżeli właśnie startujemy tych większych firm, no to możemy też się spodziewać, że nawet startując na takie pozycje jak inżynier uczenia maszynowego, będziemy mieli też zadania takie bardziej z inżynierii i oprogramowania. Także jakaś budowa systemów, a tak zwany system design to też warto ewentualnie zgłębiać w swoim zakresie, jeżeli nie mieli tego państwo na studiach, bo na przykład właśnie przyszli z innego backgroundu. Są takie po prostu rzeczy, które się mogą pojawić.

I tak jeszcze czy startup, czy duża firma, no to tutaj tak, w dużej firmie mają państwo ten plus, że częściej przyjmują juniorów i jest cały program entoringowy, gdzie ktoś państwa na początku wprowadza w te struktury, mają państwo bardzo jasno zdefiniowany zakres obowiązków, więc jest po prostu łatwiej wejść na początek.

W startupie często lepiej się zarabia, ale z drugiej strony państwa obowiązki często mogą być o wiele bardziej rozmyte i łączyć się z innymi rolami, albo nie mają państwa osoby, która byłaby bardziej doświadczona od państwa i na przykład, czy nawet jest doświadczona, ale po prostu nie ma tyle czasu ze względu na taką dynamiczną formę, jaką jest startup, nie ma tyle czasu, żeby państwa tak za tę rączkę jednak poprowadzić na początek i po prostu dostają państwo nagle masę zadań, projektów i trzeba bardzo dużo siły własnej, takiej cierpliwości, żeby przez to wszystko się przebić.

Więc to też jakby zawsze do zarozważenia, czy chcemy takie spokojniejsze wejście właśnie w jakąś firmę z jasną strukturą, czy startup, gdzie też będzie bardzo ciekawie, tylko po prostu trudniej na początek, jeżeli nie mamy tego doświadczenia zawodowego. To proszę opowiedzieć właśnie o pani doświadczeniu zawodowym, pani ścieżce. Moja ścieżka jest dosyć nietypowa. Ja ogólnie skończyłam właśnie wcześniej studia lingwistyczne i pracowałam nawet jako tłumacz, ale też na zamiędzyczasie pracę jako analityk danych i w sumie gdzieś już te technologie się pojawiały i tak się mieszały, więc postanowiłam po prostu zgłębić temat i trafiłam na polsko-japońską, co było naprawdę teraz tak z perspektywy świetną decyzją, żeby sobie i tę wiedzę pogłębić i usystematyzować.

Zaraz kończąc studia, jeden z wykładowców wspomniał mi po prostu o projekcie, gdzie szukają programisty, więc tutaj trafiłam do firmy, gdzie pracowałam jako ten programista Pajtona i zdobyłam już takie podstawowe doświadczenie, bo nie miałam praktyk. Akurat studiowałam zaocznie. Jeżeli państwo studiują dziennie, no to jest ten plus, że jest jeszcze czas na praktyki. Na studiach zaocznych tych praktyk w moim przypadku nie było. Ale zdobyłam to doświadczenie jako programista, także pracowałam w zespole, ponieważ był to projekt, który był prowadzony zdalnie, więc tutaj nie było takiej, tak dużo tego kontaktu z pozostałymi programistami, ale wiedziałam jednocześnie, że w razie problemów, no to mogę liczyć na ich pomoc, gdybym sobie z czymś nie radziła.

Po drodze też właśnie zostałam tutaj na uczelni jako wykładowcę, zaraz po obronie mi zaoferowali pracę i ponieważ miałam sama świetne doświadczenie jako student, więc stwierdziłam, że jak najbardziej chcę zostać i rozwijać się też właśnie akademicko. A w międzyczasie koleżanka z poprzednich studiów zaprosiła mnie jako mówcy na konferencję dla tłumaczy, gdzie opowiadałam właśnie o przebranżowieniu i tam poznałam swojego obecnego szefa, także po prostu networking. I jeszcze dodam, że warto też zadbać o swój profil na LinkedInie, te dwie rzeczy, czyli z jednej strony networking i to do tego właśnie świetnie jest, czy LinkedIn, czy chodzenie na konferencję i to niekoniecznie te technologiczne, tylko też właśnie z jakiejś branży, gdzie nigdy nie wiemy, gdzie tak naprawdę ta praca może nas spotkać.

Także w moim przypadku dostałam właśnie taki, można powiedzieć, take-home assignment, gdzie wykonałam mały projekt dotyczący przetwarzania języka. On akurat wykorzystywał model języka BERT, już dosyć znany i to akurat był model języka zastosowany do oceny tłumaczeń wykonywanych przez maszynę. Także jest coś takiego jak BERT Score, o tym się aż tak dużo może nie mówi, no bo jednak tłumaczenie maszynowe jest swego rodzaju niszą w dziedzinie przetwarzania języka, ale to właśnie było takie moje pierwsze zlecenie, które potem zagwarantowało mi już taką stałą współpracę z takim startupem, gdzie pracuję jako ten inżynier przetwarzania języka. Czyli tak naprawdę jest tu praca zadaniowa, prawda? Od projektu do projektu. Tak, jest to zdecydowanie praca projektowa.

To pozwala mi na te nieregularne godziny, które w połączeniu właśnie z karierą naukową są świetnym rozwiązaniem, bo nie mam takiego sztywnego planu, więc mogę sobie o wiele łatwiej to razem łączyć, plus też godzinowo zależy po prostu od miesiąca, że są miesiące, kiedy pracuję więcej, kiedy mogę sobie na to pozwolić, a kiedy na przykład mam więcej pracy na uczelni, no to po prostu biorę na siebie mniej tych dodatkowych projektów. Wiemy, jak to mniej więcej wygląda teraz, ale czy zastanawiała się pani, jak ta specjalizacja będzie się rozwijać w przyszłości? Czego pracodawcy będą oczekiwać za 5 lat, za 10 lat? W tej branży jest tak, że są lata, kiedy się dzieje więcej i mniej. Myślę, że w przyszłości to też będzie tak szło falowo.

Na przykład teraz może państwo słyszeli, że chociażby Facebook uzwalnia jedną ósmą firmy, tak samo w Twitterze nie dzieje się najlepiej, ale to nie jest obrazem całej branży technologicznej. Nam się kojarzą te wielkie firmy właśnie z tą branżą technologiczną, ale one są tylko jakąś cząstką, a naprawdę tych pozycji nawet jak się wejdzie po prostu, chociażby na wspomnianego LinkedIna jest tak dużo, że na pewno się o to nie trzeba martwić. Poza tym patrząc na to, ile firm, które wcześniej nam się nie kojarzyły z technologiami, też oferuje pracę programistom, więc myślę, że tutaj coraz więcej będzie firm właśnie jest poza branży technologicznej szukającej, szukało osób programistów czy osób z analizy danych, które będą pomagały firmie wprowadzić jakąś automatyzację.

Z drugiej strony powstają algorytmy, które piszą kod. I to też nie jest tak, że każdy zawód programisty będzie jakby gwarantował to, że będzie cały czas wykonywany. To będzie się po prostu zmieniało. Ale myślę, że tak jak z każdą inną technologią, na początku są i sceptycy i ci, którzy są zachwyceni i na początku nie do końca jeszcze wiemy, jak to się będzie kształtowało, ale w sumie patrząc na historię, za każdym razem, nawet jak były jakieś wielkie osiągnięcia czy chociażby, nie wiem, rewolucja przemysłowa, to nie jest tak, że teraz maszyny zabiorą nam już pracę i nie będzie dla nas pracy, tylko po prostu ta praca jej, może specyfika się zmieni, czyli np.

może nie będzie już potrzeby tylu programistów, którzy będą pisali sam kod, ale chociażby będą nadzorowali tę maszynę albo pisali algorytmy piszące te kody, te algorytmy. Także zmieni się po prostu może trochę specyfika. Poza tym przybywa coraz więcej danych, tak jak mówiłam wcześniej, więc myślę, że tutaj też big data będzie coraz bardziej rozwijanym zawodem i tych danych właśnie sposobów jej analizy będzie, może nie sposobów, a potrzeby tej analizy będzie po prostu przybywało, tak że na pewno osoby, które pracują w danych czy właśnie tutaj w tym naszym polu data science, czy ewentualnie w cyberbezpieczeństwie, gdzie też dany trzeba chronić, to też będą włączyły się ze sobą czy te zawody, czy po prostu możliwość ewentualnie ścieżki, zmiany trochę tej ścieżki.

A jeżeli chodzi o uczenie maszynowe, to tutaj owszem są coraz większe przełomowe systemy, ale myślę, że np. takiego AI jak z filmów to jeszcze nam wciąż daleko, więc tutaj na pewno nie trzeba się martwić, po prostu być na bieżąco z technologiami i nie bać się tych zmian, bo to jest branża dynamiczna. Tak że mieć świadomość tego, że dużo się może zmieniać, ale jednocześnie mieć też tą nadzieję, że zawsze gdzieś ta nasza praca nas spotka, bo znaczy będzie dla nas, bo to nie jest tak, że już algorytmy nas zastąpiły, czy zastąpią. Oby nie. Nie sądzę, naprawdę jakby zawsze tutaj są inne jeszcze ewentualnie ścieżki, żeby się potem przerzucić, czy na inny język, może bardziej niszowy, czy właśnie na inne zastosowania.

I też myślę, że bardzo fajna refleksja wychodzi z tej rozmowy, żebyśmy pamiętali, że możemy otworzyć się na każdą branżę i jeżeli interesujemy się czymś specyficznym, to tam również nasze umiejętności programowania mogą się przydać. Tak, tak. I jeszcze też jeżeli chodzi o dane, to na przykład wiele jest danych finansowych czy danych medycznych, także w tych branżach dużo się dzieje, ale są też te branże mniej znane, które też potrzebują automatyzacji.

I chociażby nie wiem, może branża filmowa, w sensie branża filmowa jest wielka sama w sobie, ale jakaś taka już analiza chociażby filmów właśnie za pomocą jakichś modeli maszynowych, o tym na razie jakoś tak nie słychać, więc może to też właśnie tak pomyśleć o branżach, które nam się na razie jeszcze tak nie kojarzą, a które mogłyby coś ciekawego wnieść. Czyli branża artystyczna mogłaby zostać tutaj powołana do tego zadania nowego. Jak najbardziej. No też słyszałam o modelach, które na przykład miały przewidywać wyniki meczów sportowych, także oczywiście dobrze, tu wchodzimy może troszeczkę w hazard.

Zależy też jakby etycznie, jak podejdziemy do tematu i do czego będziemy wykorzystywali nasz model, więc tutaj też bym oczywiście uczulała na to, żeby jednak zachować ostrożność i czujność i zastanowić się zawsze właśnie do czego wykorzystujemy dane i do czego ma ten model służyć. Natomiast tak, jest ta właśnie refleksja, że tutaj są branże, w które mi warto się zainteresować, także może chociażby artyści. Nowe technologie cały czas się pojawiają i teraz na dniach chociażby meta wypuściło nowy algorytm, który się nazywa SciSero. Jest to algorytm, który wykorzystuje m. in. przetwarzanie języka naturalnego, natomiast jest tak świetny, przynajmniej według tego, co twierdzi blog, mety, że w takiej grze, w dyplomację osiągną bardzo wysokie wyniki i jest w top dziesiątce uczestników.

Natomiast to, co jest zaskakujące, to że ta gra wymaga od uczestnika nie tylko znajomości języka i komunikacji, ale też metod perswazji. Więc tutaj mecie udało się stworzyć model, który nie tylko jest w stanie na poziomie człowieka komunikować się z pozostałymi uczestnikami, ale nawet wywierać na nich perswazję, podejmować myśli strategiczne i myśleć np. już na 3 czy 4 kolejki w przód właśnie o tych strategiach. Czyli tutaj w tej grze w dyplomację każdy jest reprezentantem jakiegoś kraju i kraje po prostu między sobą, tak jak w dyplomacji, podejmują albo sojusze, albo te sojusze zrywają. Generalnie bawimy się w politykę.

I model, jak się okazuje, poradził sobie bardzo dobrze, tak że nawet wielu uczestników chętnie współpracowało i zawierało sojusze właśnie z tym modelem. Bo tutaj też warto wspomnieć, że w tej grze, jeżeli uczestnik nie umie się komunikować z pozostałymi albo ta komunikacja jest utrudniona, to wtedy po prostu pozostali uczestnicy nie chcą z nim grać dalej. Tak że czy to będzie model właśnie sztuczny czy człowiek, to zasady są te same. I tu się okazuje, że jednak jest model, który już tutaj bardzo dobrze sobie poradził. Nie jest tak, że ten model nie popełnia błędów i zdarzały się chociażby przypadki, że model sugerował jakąś strategię, na przykład najechania włoch, po czym sugerował, że jednak to jest zły pomysł.

W tej samej konwersacji, czyli taka trochę sprzeczność. Ale z drugiej strony, no to model naprawdę świetnie generalnie sobie poradził, skoro dotarł do jednak top dziesiątki tych uczestników. Tak że tutaj są szalenie ciekawe implikacje, co by w takim razie to mogło zmienić dla nas. Zwłaszcza, że meta wierzy mimo wszystko w to, żeby tworzyć kod open source i ten kod tego modelu jest ogólnodostępny dla badaczy, również dla państwa, jeżeli by państwo byli zainteresowani, żeby zgłębić temat. Tak że możemy potem wziąć ten kod i spróbować to właśnie przełożyć na inne zastosowania, chociażby na chatboty, z którymi stykamy się teraz już praktycznie na wielu, chyba może nie na każdej, ale na bardzo wielu witrynach internetowych.

Na przykład, nie wiem, robimy zakupy w IKEA i pojawia się chatbot, który nam ewentualnie podpowiada, czy produkt, czy po prostu jakieś proste komunikacje. Większość tych chatbotów się opiera o taki system odpowiadania na pytania i zgadywania ewentualnie, co to pytanie właśnie, jaka jest jego intencja, jakie jest znaczenie. Natomiast model, który zaproponowało meta, mógłby podnieść poziom takiej rozmowy z chatbotem, chociażby na stronie IKEA, do poziomu rozmowy z po prostu ludzkim konsultantem. Tak że czulibyśmy się o wiele naturalniej rozmawiając z takim chatbotem, bo komunikacja byłaby o wiele płynniejsza.

Korci mnie pytanie i bardzo bym chciała się dowiedzieć, jak to zrobić w takim dużym skrócie, ale czy chodzi o to, że trzeba nauczyć właśnie tych pytań i potencjalnych odpowiedzi? Właśnie ten model jest trochę inny niż klasyczne ujęcie. W klasycznym ujęciu to byłoby tak zwany uczeniec nadzorem, czyli my pokazujemy, czego oczekujemy. W tym wypadku te pytania i odpowiedzi to jest nauczenie, że na te pytania jest taka odpowiedź. Tak że my od razu mówimy, czego oczekujemy. W tym modelu skupiono się o wiele bardziej też na takim feedbacku, czyli np. po zadaniu pytania albo po odpowiedzi były chociażby kary i nagrody za pobrawidłowe albo błędne odpowiedzi.

Ten model, jego struktura jest o wiele bardziej złożona niż ta taka klasyczna, gdzie jest po prostu A to A, B to B. Tak że dlatego jest o wiele lepszy. Ja jeszcze tego kodu nie zanalizowałam, to jeszcze mnie czeka, natomiast z tego, co właśnie opisują, no to po prostu tutaj odeszli od tego klasycznego nadawania odpowiedzi, odpowiedziałam odpowiednich klas, czyli to są te odpowiedzi, których oczekujemy, tylko jednak też skupili się właśnie na takim dotrenowywaniu na bieżąco tego modelu. I myślę, że możemy oczekiwać bardzo ciekawych wynalazków najbliższej przyszłości. Też jeszcze niebawem się ukaże nowy model języka GPT-4. Jest on bardzo mocno wyczekiwany i chodzą już pogłoski, że niektórzy mają dostęp.

Podobno w grudniu albo w styczniu przyszłego roku, najpóźniej w lutym, ma się już faktycznie pojawić. Ten model jest kolejną wersją modelu. Tutaj zaczęło się od GPT, potem było GPT-2, GPT-3. Trójka była już przełomowa, była jak do tej pory najlepszym modelem języka, jaki powstał. Tutaj sekret polegał na tym, że trójka została wytrenowana, o ile mnie pamięć nie myli, na 175 miliardach przykładów, parametrów. Natomiast ten nowy model ma być na trillionach parametrów. Także tutaj po prostu liczba przykładów treningowych jest tak oszałamiająca, że doprowadziła właśnie do naprawdę niesamowitego modelu.

Jedyne co to twórcy tutaj na początku dawali ograniczony dostęp ze względu na etykę, ponieważ już trójka potrafiła chociażby tworzyć fake newsy na tak dobrym poziomie, że było trudno je odróżnić od prawdziwych newsów. Bo to były takie bardzo dorobne sugestie. I to właśnie na tym etapie językowym można czasami tyle rzeczy przemycić, że nie jest to tak łatwo wychwycić, nie jest to takie po prostu czarno-białe. A temat fake newsów jest przeogromny. Tak i też z nimi będziemy sobie jak najbardziej w przeszłości musieli radzić, więc tutaj cały czas jest dużo rzeczy, którymi możemy się zająć i działać po prostu dla lepszego świata. Myślę, że to jest fantastyczna myśl finalizująca tę rozmowę. Bardzo dziękujemy. Naszym gościem była pani Dominika Wnuk.

Bardzo dziękuję i zapraszam serdecznie na polsko-japońską na zajęcia. Na początek podcastu jest tworzony przez Polsko-Japońską Akademię Technik Komputerowych w Warszawie. Materiał przygotowała dla Was Kinga Rudas. Do usłyszenia w kolejnym odcinku. .

S K R Y B O T

Transkrypcje

Regulamin

Katalog

Kontakt

Skrybot. 2023, Transkrypcje video z YouTube

Informujemy, że odwiedzając lub korzystając z naszego serwisu, wyrażasz zgodę aby nasz serwis lub serwisy naszych partnerów używały plików cookies do przechowywania informacji w celu dostarczenie lepszych, szybszych i bezpieczniejszych usług oraz w celach marketingowych.