debaty / ankiety i podsumowania

Modernistyczny prompt a grafomania 2.0, czyli dlaczego AI nie napisze za nas dobrej literatury

Inez Okulska

Głos Inez Okulskiej w debacie „Granice literatury”.

strona debaty

Gdzie dziś kończy się literatura? Wprowadzenie do debaty „Granice literatury”

Naj­pierw była peł­no­praw­na pro­za, ze wstę­pem, roz­wi­nię­ciem i zakoń­cze­niem, oraz peł­ne dorod­nej sym­bo­li­ki wier­sze, rów­no skro­jo­ne niczym żywo­pło­ty w angiel­skich ogro­dach. Linio­we nar­ra­cje, w ogó­le jakieś nar­ra­cje, posta­ci z krwi i kości, i nade wszyst­ko to zna­mien­ne, wiel­kie, lite­rac­kie coś, co autor chciał nam powie­dzieć. A potem autor umarł i naj­pierw wkro­czy­li­śmy do jego gabi­ne­tu i prze­trzą­snę­li­śmy szu­fla­dy, peł­ne szki­ców i nie­do­koń­czo­nych, może nawet nigdy nie­za­mie­rzo­nych, tre­ści, by bez­par­do­no­wo czy­tać je po swo­je­mu, a następ­nie spo­mię­dzy okła­dek wypu­ści­li­śmy niczym z kla­tek wszel­kie dzie­ła: od dzi­siaj jeste­ście wol­ne, może­cie weso­ło trze­po­tać zna­cze­nia­mi w takt czy­tel­ni­czych doznań. Wyeman­cy­po­wa­na lite­ra­tu­ra wyszła na uli­cę, jed­na zaj­rza­ła pod spód­ni­cę, do kosza, rynsz­to­ku, roz­go­ści­ła się w meli­nie, inna w cia­snym gar­ni­tu­rze pogna­ła do kor­po­ra­cji na spo­tka­nie, któ­re mogło­by być mailem. Bez auto­ra, zle­pio­na z przy­god­nych wra­żeń, slo­ga­nów i języ­ko­wych arte­fak­tów, zachły­śnię­ta samą sobą, na pierw­szy plan wysu­nę­ła sło­wo, peł­ne fak­tur i dźwię­ków, nama­cal­ne, samo­wy­star­czal­ne. Na tym nowym balu lite­rac­ko­ści nie­gdyś wdzięcz­ne, linio­we nar­ra­cje teraz zde­cy­do­wa­nie dłu­żej pod­pie­ra­ły ścia­ny, coraz czę­ściej do same­go koń­ca nie­pro­szo­ne przez niko­go.

Zachwy­ca­li­śmy się lite­ra­tu­rą post­mo­der­ni­stycz­ną, na nowo wyma­ga­ją­cą, bo nie­oczy­wi­stą, a jed­no­cze­śnie peł­ną moż­li­wo­ści – czy­tel­nik jako pan i wład­ca sen­su mógł teraz dobro­wol­nie błą­dzić po labi­ryn­tach wła­snych sko­ja­rzeń, zamiast pro­stych histo­rii, były paję­czy­ny zna­czeń, lite­rac­kie gra­fy o węzłach wyzna­czo­nych przez sło­wa, imio­na, gra­ficz­ne for­my zapi­su.

Aż pew­ne­go dnia, niczym Cho­choł na wese­lu, poja­wi­ła się sztucz­na inte­li­gen­cja (AI). Taka, któ­ra gene­ru­je tek­sty, obra­zy i fil­my wideo. Jed­ni zasty­gli, inni się ucie­szy­li, pozo­sta­li wsz­czę­li lament – ale przede wszyst­kim, jak to zazwy­czaj z nie­spo­dzie­wa­ny­mi dzi­wa­dła­mi bywa, zanim zdo­ła­ła się porząd­nie przed­sta­wić, natych­miast obro­sła w mity i uprze­dze­nia.

„ChatGPT to tyl­ko sto­cha­stycz­na papu­ga, któ­ra się­ga jedy­nie po naj­bar­dziej praw­do­po­dob­ne następ­ne sło­wo” – ileż razy to już sły­sze­li­śmy? Że jak „dzień”, to „dobry”, jak „w imię”, to „ojca”, i tak dalej. Tak, duże mode­le języ­ko­we opie­ra­ją się na praw­do­po­do­bień­stwie, ale nie bez zna­cze­nia jest fakt, że ten zarzut mógł mieć więk­szą siłę dwa lata temu, ale już nie­ko­niecz­nie teraz. Obec­ne mode­le to wie­lo­gło­we hydry, czy­li wie­lo­po­zio­mo­we archi­tek­tu­ry, któ­re oprócz solid­ne­go mate­ria­łu bazo­we­go (te wszyst­kie tek­sty, obra­zy i mul­ti­me­dia, któ­re zoba­czy­ły i prze­ana­li­zo­wa­ły w pierw­szym pro­ce­sie kształ­to­wa­nia swo­jej wie­dzy o świe­cie i mode­lu języ­ka), prze­szły kolej­ne eta­py tre­nin­gu: umie­jęt­ność rozu­mie­nia i wyko­ny­wa­nia kon­kret­ne­go typu pole­ceń (np. streść, napisz, pod­su­muj, określ, wymyśl, znajdź róż­ni­ce, nazwij sła­be i moc­ne stro­ny etc.), oraz szko­le­nie z dobrych manier, czy­li naukę pre­fe­ren­cji (któ­ra odpo­wiedź jest lep­sza, bar­dziej pożą­da­na ze wzglę­du na for­mę, życz­li­wość, przy­dat­ność, etc.); a dodat­ko­wo obu­do­wa­ne są dostę­pem do posze­rzo­nych źró­deł (Inter­net, kom­pi­la­tor kodu), i całe­go zesta­wu fil­trów lub mode­li pomoc­ni­czych, któ­rych dokład­ne­go zakre­su pil­nie strze­gą dostaw­cy.

Jak więc dzia­ła­ją i o co cho­dzi z tym praw­do­po­do­bień­stwem? Gdy zada­je­my mode­lo­wi pyta­nie, ono wyzna­cza kie­ru­nek (dosłow­nie, bo w wyni­ku mno­że­nia macie­rzy wek­to­rów otrzy­mu­je­my kolej­ne wek­to­ry), wzdłuż któ­re­go nale­ży iść po prze­strze­ni wag, czy­li zesta­wów liczb kodu­ją­cych miliar­dy słów i zdań (a wca­le nie całych tek­stów!), żeby dojść do wła­ści­we­go „kata­lo­gu”. Kata­lo­gu wła­ści­we­go, czy­li takie­go, w któ­rym praw­do­po­dob­nie znaj­dzie się zestaw słów, wyra­żeń lub zdań przy­dat­nych do tego, by zare­ago­wać na nasze pyta­nie.

Nato­miast nie ma już mowy o śle­pym docze­pia­niu następ­nych słów jak w pry­mi­tyw­nych algo­ryt­mach gene­ra­tyw­nych typu łań­cu­chy Mar­ko­wa. Owo „praw­do­po­do­bień­stwo” nie jest już skła­do­wą pro­ste­go ran­kin­gu czę­sto­ści wystę­po­wa­nia słów po sobie, a wyni­kiem mno­że­nia wspo­mnia­nych macie­rzy kodu­ją­cych (moc­no uprasz­cza­jąc) tema­ty, zna­cze­nia, wydźwię­ki, sty­le – ono nas pro­wa­dzi w odpo­wied­nie rejo­ny, pozwa­la zawę­zić per­spek­ty­wę w tym oce­anie słów i zna­czeń. Ale to praw­do­po­do­bień­stwo, co istot­ne, idzie dalej pod rękę z pew­ną dozą loso­wo­ści, bo iść z nią musi – ina­czej na to samo pyta­nie dosta­wa­li­by­śmy zawsze dokład­nie tę samą odpo­wiedź i bar­dzo szyb­ko koń­czy­ły­by się moż­li­we następ­ne sło­wa. W ten spo­sób nie­chyb­nie zbie­ga­ły­by wszyst­kie sło­wa do zdań albo tak bez­piecz­nie sztam­po­wych jak z ele­men­ta­rza, albo tak spek­ta­ku­lar­nych, jak zie­lo­ne idee u Chomsky’ego. Owa nie­zbęd­na loso­wość to zresz­tą jed­no­cze­śnie jed­na z głów­nych wino­waj­czyń halu­cy­na­cji, ale nimi nie będzie­my się tu zaj­mo­wać, wszak są one prze­ja­wem swo­istej kre­atyw­no­ści, a o tę w lite­ra­tu­rze – czy to ludz­kiej czy gene­ro­wa­nej przez AI – zawsze będzie­my wal­czyć.

Oprócz loso­wo­ści mamy jesz­cze w mode­lach zaszy­tą auto­re­gre­sję, któ­ra pozwa­la na to, by nie tyl­ko gene­ro­wać kolej­ne sło­wa, zda­nia czy zapla­no­wa­ne kro­ki, ale też w odpo­wied­nim momen­cie wra­cać do efek­tu tej gene­ra­cji i ana­li­zo­wać wstecz­nie (reflek­to­wać), w kon­tek­ście przy­ję­tych kry­te­riów i w razie potrzeb mody­fi­ko­wać, odrzu­cać, pod­mie­niać. Ta uważ­na auto­lek­tu­ra o wie­le bliż­sza jest zresz­tą ludz­kim mecha­ni­zmom samo­kon­tro­li niż chcie­li­by­śmy to przy­znać.

No dobrze, krzy­czą następ­ni – może i nie­co wykwint­niej kom­po­nu­je AI swo­je tek­sty, ale tyl­ko dla­te­go, że wro­go prze­ję­ła całą twór­czość czło­wie­ka, nasy­ci­ła się naszym dobrem inte­lek­tu­al­nym i teraz bez­czel­nie uży­wa tych przez wie­ki z mozo­łem utka­nych fra­ze­olo­gicz­nych i reto­rycz­nych połą­czeń, by z nich two­rzyć wła­sne tek­sty.

Ale czy to nie jest kwin­te­sen­cja wykształ­ce­nia, któ­re­go życzy­li­by­śmy wszyst­kim autor­kom i auto­rom? Czy nie na tym pole­ga nauka pisa­nia, że naj­pierw czy­ta­my, z uwa­gą i nie bez satys­fak­cji odda­jąc się inży­nie­rii wstecz­nej, i ana­li­zu­je­my, jak ten czy ów kon­stru­ował swo­je dzie­ła, z cze­go skła­da się ich feno­men? Że o eks­plo­zji cyta­tu, inter­tek­stu­al­nych nawią­zań czy wręcz całych gatun­ków lite­rac­kich opar­tych na dosłow­nym prze­ję­ciu cudzych frag­men­tów nie wspo­mnę. Czy na słyn­ne Can­tos Ezry Poun­da czy Sosnow­skie­go zaba­wy w Po tęczy chcie­li­śmy się obu­rzać?

Ale dobie­ga­ją kolej­ne gło­sy sprze­ci­wu: mode­le mogą pisać w czy­imś sty­lu, imi­to­wać czyjś oso­bi­sty, przez lata two­rzo­ny idiom, dla­te­go, że cały dostęp­ny pisar­ski kor­pus bez pyta­nia (kto i kogo miał pytać..?) został wzię­ty do tre­nin­gu. Bez nie­go było­by to nie­moż­li­we, trze­ba więc arty­stom zadość­uczy­nić udział w tym pisar­skim kar­na­wa­le, na któ­ry wca­le się nie pisa­li. Ale prze­cież już ponad pół wie­ku temu feno­me­nal­ny Ray­mond Quene­au poka­zał, że potra­fi napi­sać tę samą histo­rię na 40 róż­nych spo­so­bów, gene­ru­jąc kolej­ne, coraz bar­dziej wyszu­ka­ne sty­le, a u nas nie mniej wybit­nie Jan Gon­do­wicz oddać je w pol­sz­czyź­nie. Albo Grze­gorz Uzdań­ski, któ­re­go z peł­nym prze­ko­na­niem tu i ówdzie zda­rza­ło mi się już okre­ślać mia­nem „ludz­kie­go GPT”, bo zdo­łał traf­nie ziden­ty­fi­ko­wać i na nowo wypeł­niać tre­ścią algo­ryt­my (poety­ka to też algo­rytm) cechu­ją­ce ponad 100 zna­nych auto­rów, by następ­nie prze­ko­nu­ją­co two­rzyć w sty­lu każ­de­go z nich nowe tek­sty.

Czy kie­dy­kol­wiek oprócz zachwy­tu nad języ­ko­wym talen­tem paro­dy­sty poczu­li­śmy palą­cą potrze­bę spra­wie­dli­wo­ści pod adre­sem paro­dio­wa­nych? A wspo­mnie­ni Quene­au, Gon­do­wicz – ileż oni się musie­li naczy­tać innych auto­rów, sko­ro mogą z taką swa­dą pisać tek­sty w dowol­nie wybra­nym sty­lu, jak oni mogli, tak roz­wi­jać swój warsz­tat na cudzych dzie­łach!  Czy wie­dza nie mia­ła być dobrem powszech­nym, nie­po­li­czal­nym, demo­kra­tycz­nie dostęp­nym każ­de­mu, kto zechce po nią się­gnąć, bez podat­ku i opłat z gwiazd­ką? I czyż lite­ra­tu­ra sama w sobie nie jest zbu­do­wa­na ze słów już po wie­lo­kroć uży­tych, czyż nie jest z zało­że­nia wie­lo­au­tor­skim, budo­wa­nym przez wie­ki palimp­se­stem? W swo­im ese­ju „Sie­ci neu­ro­no­we typu GAN i GPT‑2, sło­wa zuży­te i kre­atyw­ność, czy­li lite­rac­ki second-hand”[1] sta­wia­łam tę też już przy oka­zji pierw­szych, jesz­cze racz­ku­ją­cych mode­li gene­ra­tyw­nych, ale może teraz war­to do niej wró­cić i zadu­mać się ponow­nie nad (dozwo­lo­ną) rolą współ­dzie­le­nia myśli i języ­ka.

Ale spo­koj­nie, zanim na stół wyja­dą wszyst­kie noże, któ­re Wam się wła­śnie otwo­rzy­ły w roman­tycz­nej kie­sze­ni – się­gnij­my po fak­ty. Po pierw­sze w zbio­rach uczą­cych dużych mode­li tak napraw­dę naj­więk­szy pro­cent sta­no­wią tek­sty użyt­ko­we, w naj­lep­szym wypad­ku infor­ma­cyj­ne (arty­ku­ły pra­so­we), praw­ne, mate­ria­ły edu­ka­cyj­ne czy nauko­we oraz gigan­tycz­ne kor­pu­sy tek­stów o walo­rach lite­rac­kich zde­cy­do­wa­nie bliż­szych gra­fo­ma­nii niż lite­ra­tu­rze wyso­kiej (blo­gi, komen­ta­rze, nie­re­da­go­wa­ne wypo­wie­dzi). Budo­wa mode­li otwar­tych, co do któ­rych zna­ne są zbio­ry uży­te w tre­nin­gu, dość dobit­nie dowo­dzi, że nawet model nauczo­ny wyłącz­nie na wyżej wspo­mnia­nej mie­szan­ce, lub ewen­tu­al­nie wzbo­ga­co­ny o lite­ra­tu­rę z dome­ny publicz­nej (a więc w więk­szo­ści moder­ni­stycz­ną lub jesz­cze wcze­śniej­szą, bez praw do rosz­czeń), w zupeł­no­ści wystar­czy, by zbu­do­wał cał­ko­wi­cie funk­cjo­nal­ną siat­kę pojęć i rela­cji języ­ka, któ­ra pozwo­li mu two­rzyć popraw­ne, poto­czy­ste wypo­wie­dzi na nie­mal każ­dy temat.

Po dru­gie model języ­ko­wy jest przede wszyst­kim języ­ko­wy, nie lite­rac­ki. Może więc spójrz­my na AI jak na lite­ra­tu­rę. Nie jak na byt, nie jak na narzę­dzie, lecz jak na dzie­ło wywo­dzą­ce się z awan­gar­do­wych ruchów lite­rac­kich – zapro­po­no­wał Jerzy Sta­cho­wicz[2], ale choć kuszą w dys­ku­sjach o AI meta­fo­ry maszyn lite­rac­kich, to model języ­ko­wy jest tak napraw­dę dokład­nie tym, na co wska­zu­je jego nazwa – zope­ra­cjo­na­li­zo­wa­ną iden­ty­fi­ka­cją sys­te­mu języ­ka, z uwzględ­nie­niem wszyst­kich ele­men­tów de Saus­sie­row­skiej typo­lo­gii (lan­ga­ge, lan­gue i paro­le).

Nie­wie­le się ten mecha­nizm zresz­tą róż­ni od ludz­kie­go. Każ­dy spraw­ny inte­lek­tu­al­nie czło­wiek, wycho­wy­wa­ny w spo­łe­czeń­stwie, nabie­ra zdol­no­ści posłu­gi­wa­nia się języ­kiem, nie­za­leż­nie od ilo­ści prze­czy­ta­nej lite­ra­tu­ry. Jeden będzie miał talent, języ­ko­wą intu­icję, lep­szy roz­kład wewnętrz­nych „wag”, dzię­ki któ­re­mu spraw­niej będzie zesta­wiał ze sobą pozna­ne ele­men­ty, inny będzie potrze­bo­wał tysię­cy prze­czy­ta­nych tek­stów, żeby zro­zu­mieć wzor­ce i zacząć ich zgrab­nie uży­wać. Ale nawet w tym sce­na­riu­szu nie jest koniecz­ne, aby wio­dą­cym ele­men­tem edu­ka­cji były tek­sty lite­rac­kie. Filo­zo­ficz­ne dys­pu­ty czy praw­ne ery­sty­ki, dobrze napi­sa­ne bran­żo­we tek­sty nauko­we – one rów­nież z powo­dze­niem obra­zu­ją moż­li­wo­ści języ­ka. Jak­kol­wiek wygod­nie nam sądzić, że model zdol­ny imi­to­wać pisa­nie opo­wia­dań czy wier­szy musi być pokło­siem całej ludz­kiej lite­ra­tu­ry, to tak nie­ste­ty nie jest. Osta­tecz­nie na pozio­mie samej mate­rii lite­ra­tu­ra jest stwo­rzo­na ze słów – a lite­ra­tu­ra pono­wo­cze­sna dobit­nie nas o tym prze­ko­ny­wa­ła – nie­rzad­ko tych samych, któ­rych uży­wa­my na co dzień, w zupeł­nie nie­li­te­rac­kich kon­tek­stach.

Na osło­dę dodam, że dzie­ła cał­ko­wi­cie stwo­rzo­ne przez AI po pierw­sze nie pod­le­ga­ją pra­wu autor­skie­mu[3], więc nikt się łatwo na nich w rozu­mie­niu autor­skie­mu tan­tie­mu nie wzbo­ga­ci. A po dru­gie takie zupeł­nie nie­na­dzo­ro­wa­ne w prze­wa­ża­ją­cej więk­szo­ści jako­ścio­wo bar­dzo sła­be i ryn­ko­wi lite­rac­kie­mu nie zagra­ża­ją. I tu prze­cho­dzi­my do ostat­nie­go z obie­go­wych mitów, któ­re war­to wziąć pod lupę.

W nie­daw­nej dys­ku­sji na temat związ­ków AI z lite­ra­tu­rą Doro­ta Kotas, pró­bu­jąc kon­tro­wać zasad­ność ist­nie­nia narzę­dzi gene­ra­tyw­nych w prze­strze­ni lite­rac­kiej, się­ga­ła po obie­go­we wyobra­że­nie o tym, że wystar­czy jed­no pole­ce­nie wpi­sa­ne do mode­lu, by jak za dotknię­ciem magicz­nej różdż­ki otrzy­mać skoń­czo­ne, peł­ne dzie­ło lite­rac­kie, któ­re z satys­fak­cją oszu­sta moż­na zanieść wydaw­cy. Ten nie­ludz­ki, hanieb­ny w swej pro­sto­cie czyn, odar­ty ze wszyst­kich cnot pisar­skich prze­ciw­sta­wia się oczy­wi­ście wysił­kom arty­sty, dłu­gie­mu namy­sło­wi, cier­pie­niom i bólom two­rze­nia, całe­mu, koniecz­nie dłu­gie­mu i żmud­ne­mu pro­ce­so­wi kre­owa­nia praw­dzi­wej sztu­ki. Pomi­ja­jąc nie­co już komicz­ny roman­tyzm tego obraz­ka i pyta­nie o to, czy w takim razie Gał­czyń­ski piszą­cy wier­sze na kola­nie (a raczej na ser­wet­ce), w kawiar­ni, na akord, żeby tyl­ko dostać kolej­ny tru­nek, nie zasłu­gu­je na uzna­nie swo­ich dzieł jako dość lite­rac­kich – pomi­ja­jąc w ogó­le wszyst­kie obec­ne w histo­rii lite­ra­tu­ry przy­kła­dy weny, któ­ra pozwa­la­ła auto­rom napi­sać swo­je dzie­ła spraw­nie, bez bólu, cier­pie­nia i wyrzu­ca­nia pokre­ślo­nych kar­tek, trze­ba roz­pra­wić się z błęd­nym zało­że­niem co do rze­czy­wi­stych moż­li­wo­ści obec­nych mode­li AI.

Pisa­nie z cza­tem to cał­kiem żmud­na pra­ca z tek­stem. Nikt tu nie popra­cu­je za nas, a zwłasz­cza nie przej­mie za nas myśle­nia. Nawet jeśli LLM dys­po­nu­je umie­jęt­no­ścia­mi odpo­wied­ni­mi do szyb­kie­go wyge­ne­ro­wa­nia żąda­ne­go przez nas tek­stu, to jeśli chce­my, żeby był cie­ka­wy i na serio speł­niał nasze zało­że­nia, musi­my ten tekst two­rzyć, nawet nie współ­two­rzyć. Musi­my nego­cjo­wać, zada­wać pyta­nia, two­rzyć pod­po­wie­dzi – znów się­gam do Jerze­go Sta­cho­wi­cza, bo w punkt demi­sty­fi­ku­je ten pro­ces. Nawet naj­now­sze mode­le, te „myślą­ce”, w płat­nej sub­skryp­cji, wciąż poty­ka­ją się o wła­sne sznu­rów­ki, gdy chce­my stwo­rzyć dłuż­sze, spój­ne, logicz­ne wypo­wie­dzi. I to nie­za­leż­nie od tego, czy to raport kwar­tal­ny na pod­sta­wie danych, czy frag­ment powie­ści albo dłuż­sze opo­wia­da­nie.

  1. Rand­ka – dziew­czy­na i chło­pak, flirt, seks.
  2. Następ­ne­go dnia – kurier­ka (dziew­czy­na z rand­ki) dostar­cza piz­zę klient­ce, wda­je się w pyskówkę.
  3. Na klat­ce czu­je ucisk w brzu­chu i zawro­ty gło­wy.
  4. Po wyj­ściu z klat­ki zacho­dzi do apte­ki po test cią­żo­wy.
  5. W domu wcho­dzi do łazien­ki, robi test, wynik wycho­dzi pozy­tyw­ny.

To frag­ment pla­nu wyda­rzeń do przy­kła­do­we­go opo­wia­da­nia, w któ­rym istot­nym ele­men­tem jest przy­pad­ko­wa cią­ża – model tak bar­dzo chciał już dojść do klu­czo­we­go ele­men­tu nar­ra­cji, że zupeł­nie nie widział pro­ble­mu w tym, by naza­jutrz po uda­nej rand­ce pozwo­lić boha­ter­ce naj­pierw już poczuć symp­to­my cią­ży (i to dość dys­ku­syj­ne same w sobie), a następ­nie zro­bić test i dowie­dzieć się, że oto jest w cią­ży. Dobę po sto­sun­ku! W innym przy­kła­dzie model zgu­bił logi­kę płci, z któ­rej wyni­ka­ło, że na tej rand­ce kobie­ta zaszła w cią­żę z inną kobie­tą. W jesz­cze innym, pró­bu­jąc opi­sać sce­nę na klat­ce scho­do­wej, mie­szał sce­ne­rię przy­pad­ko­we­go blo­ku klient­ki (sąsia­dów, zna­nych ele­men­tów świa­ta przed­sta­wio­ne­go) z blo­kiem, w któ­rym miesz­ka boha­ter.

Jeśli popro­sić model o ele­men­ty kon­tro­wer­syj­ne, nie­ty­po­we, takie, z któ­ry­mi mógł­by empa­ty­zo­wać czy­tel­nik, albo co gor­sza humo­ry­stycz­ne – prze­pad­nie z kre­te­sem. I z peł­nym prze­ko­na­niem o wła­snej racji, bo w każ­dym przy­pad­ku gotów nam wytłu­ma­czyć, dla­cze­go dany pomysł jest wybit­ny, a żart śmiesz­ny. Choć w rze­czy­wi­sto­ści jed­no i dru­gie będzie w naj­lep­szym wypad­ku banal­ne, w naj­gor­szym po pro­stu bez sen­su. A war­stwie reto­rycz­nej jesz­cze bar­dziej pła­sko.

Dobra lite­ra­tu­ra, szcze­gól­nie ta „post”, ale nie tyl­ko, wyróż­nia się tym, co nie­oczy­wi­ste, nie­praw­do­po­dob­ne – wyso­ki rejestr zesta­wio­ny nagle z czymś banal­nie codzien­nym, try­wial­nym, prze­kleń­stwa w poezji, nie­gdyś zare­zer­wo­wa­nej cał­ko­wi­cie dla języ­ka naj­wyż­szej ele­gan­cji, nie­oczy­wi­ste posta­ci, roz­sz­cze­pie­nia (bo nawet nie zwro­ty, jeśli nie jest linio­wa) akcji. Duże mode­le języ­ko­we dzia­ła­ją dokład­nie odwrot­nie – mają się­gać po to, co bar­dziej oczy­wi­ste, praw­do­po­dob­ne, są świet­ne w opo­wie­ściach popraw­nych, szkol­nie  „lite­rac­kich”, czy­li nie­wy­kra­cza­ją­cych poza przy­ję­te kano­nicz­ne gra­ni­ce języ­ka i struk­tur nar­ra­cji – że jak wiersz, to meta­fo­ra dopeł­nia­czo­wa, jak pro­za to „daw­no, daw­no temu”.

To nie zna­czy, że odpo­wied­nio popro­szo­ny (spromp­to­wa­ny) duży model nie będzie pró­bo­wał pora­dzić sobie z imi­ta­cją dzie­ła mniej oczy­wi­ste­go, ale to będzie (mniej lub bar­dziej uda­ny) lite­rac­ki cosplay, ode­gra­nie narzu­co­nej roli. „Natu­ral­ne” dla mode­lu są struk­tu­ry bez­piecz­ne, naj­częst­sze, prze­wi­dy­wal­ne – dosłow­nie, bo stwo­rzo­ne w wyni­ku dzia­ła­nia mecha­ni­zmu pre­dyk­cyj­ne­go następ­nych toke­nów i zdań. W tym sen­sie tek­sty two­rzo­ne z pomo­cą AI, bez świa­do­mej, dłu­giej, zło­żo­nej inge­ren­cji czło­wie­ka, sta­ją się nową for­mą gra­fo­ma­nii.

I to zarów­no w rozu­mie­niu Mila­na Kun­de­ry, któ­ry w Księ­dze śmie­chu i zapo­mnie­nia pod­kre­ślał wewnętrz­ny przy­mus pisa­nia, natych­mia­sto­we­go „gene­ro­wa­nia” coraz to kolej­nych form wypo­wie­dzi na piśmie, z inten­cją poka­za­nia ich czy­tel­ni­kom innym niż naj­bliż­si, jak i w tra­dy­cyj­nie pejo­ra­tyw­nym sen­sie pisa­nia tek­stów pozy­cjo­no­wa­nych jako lite­rac­kie, ale w isto­cie o wąt­pli­wych walo­rach lite­rac­kich.

Po demo­kra­ty­za­cji dostę­pu do powszech­nej uwa­gi, czy­li eks­pan­sji Inter­ne­tu, gdzie moż­na omi­nąw­szy redak­to­rów i wydaw­ców, obwiesz­czać świa­tu swo­je sło­wa (blo­gi!), mamy dodat­ko­wy gwóźdź do trum­ny maso­wej jako­ści, czy­li maszyn­kę do gene­ro­wa­nia ogrom­nych ilo­ści tek­stów. I choć przed chwi­lą dowo­dzi­łam, że trud­no pod rękę z AI napi­sać dobry tekst, to wciąż mamy pro­blem straż­ni­ków jako­ści – tyl­ko wte­dy mają szan­sę sta­nąć na dro­dze złe­go tek­stu, jeśli zde­cy­du­je­my się na ich kon­fron­ta­cję, czy­li wyśle­my tekst do wydaw­cy. Ale prze­cież w samo­za­chwy­cie kla­sycz­ne­go gra­fo­ma­na, moż­na taki tekst pro­sto z mode­lu opu­bli­ko­wać na tej czy innej stro­nie, w mediach spo­łecz­no­ścio­wych, i upa­jać się polu­bie­nia­mi ludzi, któ­rzy „czu­ją tak samo”.

Nowo­ścią jest więc podwo­je­nie impe­ra­ty­wu pisa­nia – autor ma potrze­bę wyra­zić owo „coś”, co koniecz­nie musi obwie­ścić świa­tu, ale zamiast samo­dziel­nie zło­żyć tę ukła­dan­kę słów, two­rzy prompt, któ­ry akty­wu­je wewnętrz­ny przy­mus pisa­nia w mode­lu AI. Ale nowa jest też sty­li­sty­ka tej gra­fo­ma­nii, bo wpraw­dzie może być kre­atyw­na w ramach dowol­nie zapro­po­no­wa­ne­go pomy­słu auto­ra promp­tu – model nie­pro­szo­ny o tę rolę, sam z sie­bie nie będzie wcho­dził w pole­mi­kę z zasad­no­ścią czy atrak­cyj­no­ścią tego pomy­słu – ale usłuż­nie roz­wi­nie ją tak, jak potra­fi naj­le­piej, czy­li naj­pierw popraw­nie, śred­nio, pła­sko.

Acz­kol­wiek dotych­czas, szcze­gól­nie w pro­zie (szczę­śli­wi ci wszy­scy, któ­rzy nie musie­li czy­tać gra­fo­mań­skiej lite­ra­tu­ry ero­tycz­nej!) łatwo było gra­fo­mań­ski cha­rak­ter tek­stu ziden­ty­fi­ko­wać już na pozio­mie same­go języ­ka, któ­ry nie­świa­do­mie kale­czył skład­nię, fra­ze­olo­gię, mie­szał zna­cze­nia, a orto­gra­fii i inter­punk­cji nie powa­żał wca­le, albo co naj­wy­żej sto­so­wał kapry­śnie. Gra­fo­ma­nia 2.0 to w isto­cie trud­niej­szy orzech do zgry­zie­nia, bo w prze­wa­ża­ją­cej więk­szo­ści zda­nia, całe ich aka­pi­ty są two­rzo­ne zgod­nie z kano­nicz­ny­mi zasa­da­mi skład­ni, inter­punk­cji i orto­gra­fii. W efek­cie powsta­ją wypo­wie­dzi w for­mie ide­al­nie satys­fak­cjo­nu­ją­cej nauczy­cie­li w pod­sta­wów­ce, któ­rzy życzy­li­by sobie, by ucznio­wie na lek­cjach języ­ka pol­skie­go pisa­li cho­ciaż tak sztam­po­wo popraw­nie. Nato­miast, jak już widzie­li­śmy przed chwi­lą, szyb­ko zdra­dzi kon­struk­cja nar­ra­cyj­na takie­go gra­fo­mań­sko dzie­wi­cze­go tek­stu, pozba­wio­ne­go świa­do­mej kura­te­li czło­wie­ka. Owszem, tu i ówdzie powsta­nie god­na uwa­gi minia­tu­ra, może mikro­opo­wia­da­nie, ale czę­sto­tli­wo­ścią tak loso­wą, jak loso­wy jest cha­rak­ter kre­atyw­no­ści mode­li i to raczej wyją­tek potwier­dza­ją­cy regu­łę.

I tu prze­cho­dzi­my do naj­waż­niej­szej tezy – któ­ra mam nadzie­ję nie­co uspo­koi roz­go­rącz­ko­wa­ne ser­ca wybit­nych auto­rów i auto­rek – nie­za­leż­nie od tego, czy chce­my pisać wspólnie z mode­lem, czy samo­dziel­nie, wciąż od gra­fo­mań­skich prób odróż­niać Was będą wyczu­cie, tego, co dobre, tego, co już może ujrzeć świa­tło dzien­ne, i porząd­ny warsz­tat lite­rac­ki, pozwa­la­ją­cy owo dobre stwo­rzyć.

Po co ten warsz­tat, gdy­by­ście mie­li two­rzyć razem z AI?

Bo obec­ne (nie)możliwości AI i spe­cy­fi­ka jej pobu­dza­nia mogą mię­dzy inny­mi wskrze­szać warsz­tat tra­dy­cyj­nej, z ducha moder­ni­stycz­nej lite­rac­ko­ści i sztu­ki nar­ra­cji. Owszem, do gene­ra­cji banal­ne­go aka­pi­tu wystar­czy banal­ny prompt i brak zna­jo­mo­ści kon­stru­owa­nia lite­ra­tu­ry – tak jak każ­dy pię­cio­la­tek nama­lu­je czar­ny kwa­drat – ale bar­dzo szyb­ko wyj­dzie na jaw, kie­dy to świa­do­my wybór arty­sty, nad któ­rym war­to się pochy­lić, bo w innych pra­cach jasno poka­zał, że ma też zna­ko­mi­ty warsz­tat reali­stycz­ne­go malar­stwa (jako­ścio­we­go pisar­stwa), a kie­dy mak­si­mum moż­li­wo­ści AI-gra­fo­ma­na.

A dla­cze­go warsz­tat moder­ni­stycz­ny? Bo nie­za­leż­nie od for­my, któ­rą osta­tecz­nie ma nasze dzie­ło przy­brać, jeśli chce­my je two­rzyć z pomo­cą AI, musi­my model odpo­wied­nio pobu­dzać – promp­to­wać. A do tego oka­zu­je się, że naj­po­trzeb­niej­sze są odau­tor­ska myśl, pre­cy­zja jej prze­ka­za­nia, struk­tu­ra wypo­wie­dzi. Że sze­ro­ki zakres epi­te­tów i umie­jęt­ność zbu­do­wa­nia pre­cy­zyj­ne­go, jed­no­znacz­ne­go opi­su posta­ci, świa­ta przed­sta­wio­ne­go czy line­ar­nej sekwen­cji wyda­rzeń, przy­da­dzą się znów bar­dziej niż kie­dy­kol­wiek. Nasz AI-cho­choł może więc zupeł­nie przy­pad­kiem zwia­sto­wać cichy rene­sans wiel­kich nar­ra­cji.

Nie poezji? Z satys­fak­cją mawia się prze­cież tu i ówdzie, że teraz, gdy język natu­ral­ny stał się języ­kiem pro­gra­mo­wa­nia, bo każ­de pobu­dze­nie mode­lu nastę­pu­je wła­śnie w for­mie wypo­wie­dzi, to na pierw­szy plan wysu­ną się poeci, praw­dzi­wi wir­tu­ozi języ­ka. Owszem, ale doczy­taj­my to, co małym dru­kiem: cho­dzi o peł­ną świa­do­mość posłu­gi­wa­nia się języ­kiem jako takim, a nie o wyszu­ka­nie lite­rac­ki wymiar same­go promp­tu.

Bo jeśli za Jakob­so­nem przyj­mu­je­my, że poezja to pogwał­ce­nie zwy­czaj­no­ści języ­ka, to ta nowa for­ma wypo­wie­dzi – ten wszech­obec­ny prompt – dokład­nie odwra­ca ten wek­tor, siłą narzu­ca­jąc języ­ko­wi daw­ny, do bólu popraw­ny porzą­dek. Sche­ma­tycz­ny, raczej pozba­wio­ny funk­cji poetyc­kiej, ale na tym pozio­mie cho­dzi o akty­wa­cję pier­wot­nej roli języ­ka. Język ma być narzę­dziem, któ­rym spraw­nie się posłu­gu­je­my, by osią­gnąć komu­ni­ka­cyj­ny cel, a nie celem samym w sobie. Jest znów środ­kiem prze­ka­zu, for­mą nio­są­cą treść.

Znów w cen­trum uwa­gi jest prze­kaz, a naj­waż­niej­szą staw­ką w tej grze o inter­pre­ta­cję jest takie prze­ka­za­nie swo­je­go zamia­ru, by była moż­li­wie kla­row­na, jed­no­znacz­na – im lepiej model zde­ko­du­je to, co autor (promp­tu) miał na myśli, tym lepiej będzie mógł zabrać się do reali­za­cji zada­nia. W tym sen­sie powra­ca warsz­tat pre­cy­zyj­ne­go, dłu­gie­go, wie­lo­aspek­to­we­go opi­su, do łask przy­wo­ła­ne zosta­ją nie­zli­czo­ne przy­miot­ni­ki, przy­słów­ki, ana­lo­gie (ale już nie­ko­niecz­nie wyszu­ka­ne meta­fo­ry), choć zamiast malo­wać obra­zy w gło­wie czy­tel­ni­ka, two­rzy seman­tycz­ne siat­ki w połą­cze­niach mode­lu. Powra­ca więc ów warsz­tat ze zdwo­jo­ną siłą, bo ta funk­cja komu­ni­ka­tyw­na ma jed­no­cze­śnie wymiar per­for­ma­tyw­ny, o nie­mal biblij­nej sile spraw­czej. Na naszych oczach sło­wo sta­je się spraw­cą – two­rzy prze­cież tek­sty, obra­zy, ana­li­zy, wykre­sy, pla­ny, porząd­ki[4].

Z jed­nej stro­ny kla­sycz­ny akt komu­ni­ka­cji, moż­li­wy dzię­ki solid­ne­mu opa­no­wa­niu dostęp­nych funk­cji języ­ka, z dru­giej zaś zna­jo­mość zasad sztu­ki nar­ra­cji, albo wręcz pod­staw nar­ra­to­lo­gii – klu­czo­wych struk­tur, porząd­ku ele­men­tów, po to by je suge­ro­wać już na eta­pie promp­tu ini­cju­ją­ce­go, ale też by przez całą dro­gę współ­pra­cy z mode­lem świa­do­mie stać na stra­ży wyni­ków kolej­nych gene­ra­cji. To tu prze­cież nasz nie­świa­do­my AI-gra­fo­man się dema­sku­je – gdy nie dostrze­ga zawcza­su, że sypie się logi­ka, roz­kle­ja­ją wąt­ki, bra­ku­je posta­ci, że tyle tych strzelb, a żad­na nie strze­la, albo co gor­sza strze­la­ją te, któ­rych jesz­cze nie zała­do­wa­no. Dla­te­go nie powin­no nas już nigdy wię­cej bul­wer­so­wać, gdy oka­że się, że dzie­ło, które zna­la­zło uzna­nie kry­tyków, tak napraw­dę było pisa­ne w asy­ście AI. Bo to tak jak­by­śmy obu­rza­li się, na to, że zamiast na maszy­nie do pisa­nia, pozwo­lił sobie arty­sta uży­wać Wor­da i to jesz­cze – co za bez­czel­ność – z auto­ko­rek­tą (która też ma pod spodem prze­cież AI!).

***

Wie­my już, że nie jest naj­now­szej gene­ra­cji sztucz­na inte­li­gen­cja aż tak bez­myśl­nie przy­pad­ko­wa, jak chcie­li­by­śmy sądzić (to coś o wie­le wię­cej niż OuLi­Po zastę­pu­ją­ce wybra­ne sło­wa ich loso­wy­mi sąsia­da­mi ze słow­ni­ka), że jej reto­rycz­na spraw­ność nie musi być pokło­siem tre­nin­gu na wyłącz­nie lite­rac­kich tek­stach oraz mimo iż „wyga­da­na”, wciąż nie jest auto­rem auto­no­micz­nym, któ­ry two­rzy spój­ne, logicz­ne, popraw­ne, war­te dłuż­szej uwa­gi czy­tel­ni­ka tek­sty lite­rac­kie. Pró­by zapla­no­wa­nia i napi­sa­nia lite­rac­ko dobrej nar­ra­cji, a potem jesz­cze obu­do­wa­nia jej języ­kiem, któ­ry nie zgu­bi logicz­nych zało­żeń ani języ­ko­we­go szwun­gu – szcze­gól­nie w pol­sz­czyź­nie – dowo­dzą, że to choć pozor­nie dostęp­ne i wszech­mo­gą­ce narzę­dzie, to praw­dzi­wej sztu­ce zagra­ża tak samo jak Pho­to­shop naj­lep­szym foto­gra­fom.

Ambi­cje lite­rac­kie mogą, choć nie muszą, roz­sze­rzyć się więc teraz o sztu­kę opa­no­wa­nia promp­tu i lite­rac­kiej nego­cja­cji z mode­lem, bo po pierw­sze sztu­ka korzy­sta­nia z mode­li w spo­sób, któ­ry by dawał napraw­dę war­te uwa­gi rezul­ta­ty w tak deli­kat­nej mate­rii jak lite­ra­tu­ra, jest nie­mal tak samo skom­pli­ko­wa­na jako samo pisa­nie, a po dru­gie tak samo wyma­ga pomy­słu i wyczu­cia arty­sty, któ­ry na każ­dym kro­ku odróż­ni lite­rac­ko sła­be od war­to­ścio­we­go. A dodat­ko­wo mło­dym poko­le­niom może przy­po­mnieć nie­co zaku­rzo­ne ele­men­ty warsz­ta­tu pisar­skie­go, któ­re sta­ją się w tym współ-pro­ce­sie two­rze­nia z AI nie­zbęd­ne.

Ape­lu­ję więc: niech bro­ni się efekt, nie spo­so­by doj­ścia, bo napraw­dę dobry efekt wyma­ga wie­dzy, umie­jęt­no­ści i talen­tu auto­ra pobu­dza­ją­ce­go sie­bie do pisa­nia lub pobu­dza­ją­ce­go model do pisar­skiej współ­pra­cy – i jest to rów­nie arty­stycz­ny spo­sób doj­ścia, a nie żaden szczę­śli­wy traf oszu­sta, za któ­ry trze­ba było­by książ­ki współ­two­rzo­ne z AI palić na sto­sie.


Przy­pi­sy:
[1] Inez Okul­ska, Sie­ci neu­ro­no­we typu GAN i GPT‑2, sło­wa zuży­te i kre­atyw­ność, czy­li lite­rac­ki second-hand, “Forum Poety­ki” nr 18 (2019) https://pressto.amu.edu.pl/index.php/fp/article/view/21436
[2] Jerzy Sta­cho­wicz, Sztucz­na inte­li­gen­cja jest lite­ra­tu­rą, https://www.dwutygodnik.com/artykul/11956-sztuczna-inteligencja-jest-literatura.html
[3] Zgod­nie z pol­skim pra­wem autor­skim, żeby utwór speł­niał prze­słan­ki dzie­ła autor­skie­go, musi być efek­tem wysił­ku twór­cy-czło­wie­ka. Por. Sła­wo­mir Kono­piń­ski, Pra­wa autor­skie w odnie­sie­niu do utworów two­rzo­nych przez sztucz­ną inte­li­gen­cję (AI) https://www.currenda.pl/prawa-autorskie-w-odniesieniu-do-utworow-tworzonych-przez-sztuczna-inteligencje-ai
[4] A wszyst­ko to w śro­do­wi­sku koniecz­ne­go dia­lo­gu, w któ­rym turn taking Sack­sa i Jef­fer­so­na przy­bie­ra for­mę abso­lut­ną, nie­mal nie­unik­nio­ną – bar­dzo trud­no jest zmu­sić model, by nie uczest­ni­czył w tym kon­wer­sa­cyj­nym ping-pon­gu.

O AUTORZE

Inez Okulska

Doktor nauk humanistycznych, magister inżynier automatyki, z ponad 8-letnim doświadczeniem w branży AI. Przez lata krytyczka literacka (publikowała m.in. w „Przekładańcu”, „Literaturze na Świecie”, „Twórczości”) i tłumaczka. Autorka modeli, algorytmów, zbiorów danych i rozwiązań AI w zakresie automatycznego przetwarzania języka naturalnego. Niegdyś adiunktka w Polsko-Niemieckim Instytucie Badawczym, później kierowała Zakładem Inżynierii Lingwistycznej w Państwowym Instytucie Badawczym NASK oraz Departamentem Innowacji i Technologii w Ministerstwie Cyfryzacji. Współzałożycielka i redaktorka naczelna pierwszych czterech numerów „hAI Magazine”, jedynego w Polsce drukowanego magazynu poświęconego AI. Prelegentka i keynote speaker wielu prestiżowych scen branżowych (w tym z serii tedX), gdzie ludzkim językiem opowiada o zawiłościach nieludzkiej inteligencji. Trenerka, edukatorka i specjalistka w zakresie rozwiązań agentowych. Wyróżniona m.in. w rankingach Top100 Women in AI in Poland oraz 25 kobiet na rok 2025 przez „Forbes Women”.