Oltre un decennio di contenuti preziosi per gli utenti sono ora in vendita, mentre Reddit si prepara a diventare pubblica.

Secondo quanto riportato ieri da Bloomberg, Reddit permetterà a "una grande azienda di AI senza nome" di accedere alla sua piattaforma di contenuti generati dagli utenti grazie a un nuovo accordo di licenza. L'accordo, "del valore di circa 60 milioni di dollari su base annua", scrive l'agenzia, potrebbe ancora cambiare, dato che i piani della società di quotarsi in borsa sono ancora in corso.

Fino a poco tempo fa, la maggior parte delle aziende che si occupano di AI addestrava i loro dati sul web senza chiedere l'autorizzazione. Ma ciò si è rivelato discutibile dal punto di vista legale, inducendo le aziende a cercare di ottenere i dati su basi più solide. Non è noto con quale società Reddit abbia concluso l'accordo, ma si tratta di una cifra ben superiore ai 5 milioni di dollari annui che OpenAI avrebbe offerto agli editori di notizie per i loro dati. Secondo il New York Times, anche Apple sta cercando di concludere accordi pluriennali con le principali società di informazione per un valore di "almeno 50 milioni di dollari".

...

Commento personale: dobbiamo prepararci ad una nuova ondata di iscrizioni su Lemmy? :) ...oppure ancora una volta l'ennesimo passo falso non sarà sufficiente a smuovere le coscienze?

    • damtux@feddit.it
      hexagon
      ·
      9 months ago

      sì, ma abbiamo già visto come funziona....é la stessa dinamica di Duolingo! Le persone dedicano gratuitamente per anni il proprio tempo e le proprie conoscenze alla crescita di una "community" (molto virgolettato) proprietaria che ad un certo punto prende quel valore e decide di rivenderselo senza remunerare chi lo ha creato.

  • kingmongoose7877@lemmy.ml
    ·
    9 months ago

    Ho visto questo articolo su un'altro sito, che mi ha fatto riflettere…

    Né Lemmy né il fediverso né Activity Pub fa qualsiasi garanzia contro il raccogliere dati dai terzi, AI o no. Qualcuno mi correga se erro, grazie.

    • damtux@feddit.it
      hexagon
      ·
      9 months ago

      essendo siti pubblici ed indicizzabili dai motori di ricerca mi sembra abbastanza ovvio che non possano dare garanzie......perché sostanzialmente non dipende solo da loro! Sono i colossi dietro alle AI che spesso hanno scelto di addestrarle su contenuti pubblicamente disponibili online (questo però non significa che la licenza di quei dati glielo permettesse, come è emerso in diverse occasioni).

      La differenza qui è che si parla di monetizzazione volontaria da parte di Reddit di quei dati che essa stessa ospita (e che ha ricevuto gratuitamente dagli utenti). Quindi se i social del Fediverso potrebbero opporsi, Reddit invece gli ha aperto la porta.

      • kingmongoose7877@lemmy.ml
        ·
        9 months ago

        SE (scritto con i caratteri 2m alti dipinti arancione) gli instance del fediverso POTREBBERO opporsi, finora non vedo nessuna mossa in quella direzione, neanche un robots.txt. Reddit, monetizzando i dati contenuti, ha messo un cartello alla porta, "Il negozio è aperto!" Il Fediverso semplicemente lascia la porta spalancata, non c'è nessuno a casa e il cane di guardia dorme è morto. Effettivamente non c'è differenza di "quei dati che ospita" Reddit o Lemmy. Correzioni sono sempre gradite.

        • damtux@feddit.it
          hexagon
          ·
          9 months ago

          su Mastodon c'è l'opzione per non permettere l'indicizzazione del profilo da parte dei motori di ricerca (concordo sul fatto che non sia molto però almeno siamo al livello del robots.txt). La difficoltà maggiore è data dal meccanismo di funzionamento delle istanze....ad es. un'istanza può essere più rigorosa, un'altra più morbida ma i contenuti di un utente (specie se pubblica contenuti pubblici) saranno presenti su entrambe le istanze (perché vengono "ricopiati" per chi segue quell'utente dalla seconda istanza). In questo caso è difficile opporsi integralmente, visto che entrambe presentano il contenuto e una lo protegge mentre l'altra meno

  • Novman@feddit.it
    ·
    edit-2
    9 months ago

    In realtà un modo per peggiorare il lavoro dell'ai c'é. Se l'ia viene trainata con i suoi stessi dati ( o di un'altra ai ) il risultato peggiora. In poche parole l'ia ha bisogno di contenuti realmente umani per funzionare. Se si postano risposte create con chatgpt si riesce a far peggiorare l'ai.

    https://futurism.com/ai-trained-ai-generated-data-interview

    La qualità dell'ai dipende in modo sostanziale dalla qualità dei dati, ed è sempre stato così. È fondamentalmente un modello statistico. Oltretutto queste ai non vivono in un mondo simulato come quelle dei giochi, ma in un mondo reale e non possono migliorare "giocando contro se stesse" , devono confrontarsi con dati reali, non prevedibili in maniera deterministica.

  • IzNoGud78@feddit.it
    ·
    9 months ago

    Almeno per quel che mi riguarda è stata la goccia che ha fatto traboccare il vaso. Avrei già voluto cancellare il mio account quando hanno modificato le API, rendendo di fatto impossibile (o quasi) l'accesso da client di terze parti... stavolta sono riusciti a convincermi ad abbandonare definitivamente il social.

    • damtux@feddit.it
      hexagon
      ·
      9 months ago

      Benvenut* su Lemmy e in generale nel Fediverso (visto che qui si può interagire anche con persone dagli altri server e software del Fediverso, come Kbin, Mastodon, Misskey, Friendica, siti web Wordpress, ecc)! 😊

      • IzNoGud78@feddit.it
        ·
        9 months ago

        non sono nuovo nel fediverso, sono iscritto da qualche anno anche su mastodon... in realtà avevo provato anche friendica, ma non mi aveva convinto molto