Rimane difficilino registrare marchi di posizione (soprattutto se consistente nella colorazione delle suole dei calzari)

Descrizione del marchio nella pagina web EUIPO: <<The mark consists of a product configuration consisting of a metallic gold sole on footwear. The dotted lines demonstrate placement of the mark and are not claimed as a feature of the mark. >>

Disegno ivi presente:

(dal fascicolo EUIPO)

Rigettata la domanda di registaizone dallEUIPOP  n° 018731419 con decisione 31 agosto u.s..: il segno  <<does not possess at first sight any distinctive character in relation to the goods pursuant to Article 7(1)(b) EUTMR and is therefore unable to function as a trade mark in the market place, i.e. it fails to distinguish these goods from those of other undertakings>>

Però la corte di giustizia UE 12.06.2018 ha validato quello rinomato di colore rosso di Louboutin (caso C-163/16) (L?ufficio non la menziona)

(segnalazione di Louise Rooms in IPKat)

Confondibilità rigettata in appello EUIPO

marchio posteriore for classes 5, 35 and 44, namely “pharmaceuticals”, “medical preparations”, “food supplements” and “dietetic substances for babies (colori rivendicati)
marchio anteriore designating, inter alia, classes 5, 30 and 32, “ia” designating goods in class 10 and “ia” designating services in class 35.

Il 1st board of appeal EUIPO 31.10.2023, case R 1529/2023-1, INTERAPOTHEK, S.A.U. v. Q4MEDIA rigetta per assebnza di confondibilità ex art. 8.1.b EUTMR.

Conclusione:

<<Overall assessment of the likelihood of confusion
36 The enhanced distinctiveness of the earlier mark was not claimed. Its inherent
distinctiveness results from the distinctive element ‘iaʼ in the central and initial position
but is weakened by the fact that its second word ‘BABYʼ is descriptive. The last word
‘interapothekʼ cannot be seen as a meaningful expression: as explained before, even if its
part ‘apothekʼ can be related to ‘Apothekeʼ (German word for ‘pharmacyʼ) the
combination with the prefix ‘interʼ lacks any tangible sense and is not descriptive. The
element may be seen as allusive but still distinctive. Overall, the inherent distinctiveness
of the earlier mark is under average.
37 The level of attention of both, the professional and the general public is high. The mark
has been found aurally similar to an average degree but conceptually and visually only to
a low degree. For the relevant goods and services the visual aspect is not less important
than the aural one, because the goods are bought on sight and the services are often
contracted on basis of written descriptions (offers, catalogues, Internet searches).
Therefore, taking into consideration the high level of attention of the relevant public and
the weakened distinctiveness of the earlier mark, the likelihood of confusion cannot be
confirmed even for identical goods. Even less so can this likelihood exist for goods that
are only similar.
38 The other earlier marks invoked in the opposition are even less similar to the EUTM
application as they overlap with the latter in only two letters, but differ in a multitude of
factors (beginning, length, font of the letter ‘aʼ, colours, initial letter/sound, number of
syllables). The likelihood of confusion does not exist on the basis of these marks either.>>

Coreografia v. “emotes” nel diritto di autore: l’appello in Hanagami v. Epic Games

Avevo notiziato il 05.09.2022 su Central District della California 24 agosto 2022, caso 2: 22-cv-02063-SVW-MRW che aveva rigettato la domanda di tutela verso l’uso nel gioco Fortnite.

Ora l’appello (in 14 mesi !!!) che riforma la sentenza di primo grado.

La sentenza è di una certa  importanza per capire la disciplina della tutela autorale dell’opera coreografica.

Dal summary iniziale:

<<Games, Inc., the creator of the videogame Fortnite, infringed
the copyright of a choreographic work when the company
created and sold a virtual animation, known as an “emote,”
depicting portions of the registered choreography.
The panel held that, under the “extrinsic test” for
assessing substantial similarity, Hanagami plausibly alleged
that his choreography and Epic’s emote shared substantial
similarities. The panel held that, like other forms of
copyrightable material such as music, choreography is
composed of various elements that are unprotectable when
viewed in isolation. What is protectable is the
choreographer’s selection and arrangement of the work’s
otherwise unprotectable elements. The panel held that
“poses” are not the only relevant element, and a
choreographic work also may include body position, body
shape, body actions, transitions, use of space, timing, pauses,
energy, canon, motif, contrast, and repetition. The panel
concluded that Hanagami plausibly alleged that the creative
choices he made in selecting and arranging elements of the
choreography—the movement of the limbs, movement of the hands and fingers, head and shoulder movement, and tempo—were substantially similar to the choices Epic made in creating the emote.
The panel held that the district court also erred in dismissing Hanagami’s claim on the ground that the allegedly copied choreography was “short” and a “small component” of Hanagami’s overall work. The panel declined to address the issue whether the work was entitled to broad or only thin copyright protection>>.

(notizia e link da Eric Goldman)

Ancora su AI, data scraping e violazione di copyright (questa volta per lo più negata)

La corte del distr. Nord della California  30 ottobre 2023, Case 3:23-cv-00201-WHO, Andersen v. Stability AI, DeviantArt, Midjourney, esamina il tema in oggetto (segnalazione e link di Jess Miers su X).

Le domande sono tutte rigettate tranne quelal verso Stability, per la quale è cocnessa facoltà di modifica:

<<3. Direct Infringement Allegations Against Stability Plaintiffs’ primary theory of direct copyright infringement is based on Stability’s creation and use of “Training Images” scraped from the internet into the LAION datasets and then used to train Stable Diffusion. Plaintiffs have adequately alleged direct infringement based on the allegations that Stability “downloaded or otherwise acquired copies of billions of copyrighted images without permission to create Stable Diffusion,” and used those images (called “Training Images”) to train Stable Diffusion and caused those “images to be stored at and incorporated into Stable Diffusion as compressed copies.” Compl. ¶¶ 3-4, 25-26, 57. In its “Preliminary Statement” in support of its motion to dismiss, Stability opposes the truth of plaintiffs’ assertions. See Stability Motion to Dismiss (Dkt. No. 58) at 1. However, even Stability recognizes that determination of the truth of these allegations – whether copying in violation of the Copyright Act occurred in the context of training Stable Diffusion or occurs when Stable Diffusion is run – cannot be resolved at this juncture. Id. Stability does not otherwise oppose the sufficiency of the allegations supporting Anderson’s direct copyright infringement claims with respect to the Training Images>>.

Provvedimento itneressante poer chi si occupa del tema, dato che da noi ancora non se ne son visti.

Famiglia di marchi (a fini del giudizio di confondibilità)

App. Milano 3057 / 2’023 del 30.10.2023, rg 2355/2021.rel. Cortelloni, Sergio Ricci spa c. Sergio Rossi spa:

<<La Corte rileva che una “famiglia di marchi”, per essere tale, presuppone un “marchio capostipite” e altri marchi che riproducono lo stesso nucleo fondamentale, identificativo ed evocativo di determinati prodotti, con eventuali mere varianti grafiche, che, peraltro, devono apparire accessorie e marginali rispetto al nucleo fondamentale considerato.
Nel caso in esame, i segni di Stefano Ricci spa oggetto di disamina, come detto, sono i seguenti: …

Orbene, con riferimento a tali segni, sembra a questa Corte che la possibilità di ravvisare in essi un “nucleo fondamentale comune” incontri un forte ostacolo nel fatto che l’utilizzo delle lettere “SR” avviene – in ciascuno dei marchi considerati – con modalità del tutto particolari e differenti: talvolta, mediante l’impiego di forme “classicheggianti” (1); altre, con l’ulteriore inserimento di una cornice geometrica e decorata, a forma ottagonale, dentro la quale le lettere sono inserite su sfondo bianco (2); ancora, mediante l’utilizzo di decori intrecciati tali da rendere meno riconoscibili ed evidenti le lettere e da evidenziare maggiormente l’aspetto decorativo (3); in un altro caso, mediante l’utilizzo delle lettere con modalità non intrecciate e distanti fra loro, in “stampatello” maiuscolo e aventi fondo bianco /sfumato (4); infine, utilizzando forme moderne e quasi geometriche ove, ancora una volta, il richiamo alle lettere “SR” appare molto meno evidente e riconoscibile (5).
Pertanto, in assenza di un “nucleo fondamentale comune” – che non si ripete in modo costante ed evidente – non sembra possibile ravvisarsi, in concreto, l’esistenza di una “famiglia di marchi”, nel senso auspicato da parte appellante>>

E’ concorrenza sleale (ex art. 2598 n. 3 c.c.) proporre ai clienti del concorrente un’offerta reticente ed omissiva

 Trib.  Milano n. 3038/2023 del 17.04.2023, RG 40547/2023, rel.  Fazzini, Iliad c.  Vodafone:

<<All’interno di questo ambito, si deve ritenere che, nel caso di specie, Vodafone Italia Spa ha utilizzato sms o altre comunicazioni, caratterizzate da un messaggio pubblicitario che utilizza il prezzo come strumento di concorrenza, senza che, però, fosse stato evidenziato in maniera adeguata il prezzo complessivo, ovvero tutte le voci di prezzo o costo del servizio, essendo state omesse alcune singole componenti, quali i costi della SIM, di attivazione, etc. È evidente che tale comportamento non sia conforme alle regole della lecita concorrenza, atteso che l’utente non era stato messo nelle condizioni di effettuare una valutazione corretta nel formare un primo convincimento prima della sottoscrizione del contratto, con conseguenze negative anche al fine della scelta di un gestore piuttosto che un altro. Così come strutturati i messaggi, il tribunale ritiene che non ci fossero elementi per poter ritenere che il potenziale utente potesse supporre che accedendo al servizio avrebbe dovuto affrontare ulteriori costi iniziali rispetto a quelli già indicati. Si osserva, infatti che, dato che l’offerta esplicitava un costo periodico mensile nel caso in cui l’utente fosse voluto tornare a Vodafone o passare a tale società, senza alcun ulteriore riferimento a informazioni o a costi aggiuntivi, anche attraverso un richiamo a un sito internet, allo stato, non sussistono elementi perché esso avrebbe potuto intendere che l’offerta presupponeva invece anche un addebito di un costo iniziale, essendo evidente che esso aveva percepito l’offerta, in sostanza, come una sorta di abbonamento senza costo di attivazione, proprio per invogliare il cliente a ritornare sulle proprie scelte, o in cui gli eventuali costi iniziali erano stati assorbiti nel pagamento del canone fisso.
Rilevante a tale riguardo è anche la circostanza pacifica che per tali condotte Vodafone Italia Spa sia stata sanzionata dall’AGCM con provvedimento del 6.12.2019. In ordine alla rilevanza probatoria di tale provvedimento, si osserva che, benché non sia condivisibile quanto asserito da parte attrice in ordine a un suo valore probatorio privilegiato, essendo circostanza pacifica che tale provvedimento è stato oggetto di impugnazione davanti al TAR, con la conseguenza che, allo stato, esso non ha alcun specifico valore di carattere decisorio definitivo, alla luce dei principi espressi dalla Suprema Corte (cfr. Cass. 3640/2009; Cass. 5941/2011; Cass. 5942/2011), è evidente che comunque esso abbia un valore indiziario a favore della tesi di parte attrice ai fini della individuazione di un comportamento di concorrenza sleale>>.

Nessuna  liquidazione di danno, però:

<<In considerazione di ciò, il Collegio ritiene che sia evidente che, allo stato, non sussiste alcuna prova in ordine al fatto che i messaggi in questione siano stati diretti ai clienti Iliad e in quale misura e se essi abbiano determinato questi ultimi a scegliere di tornare al vecchio operatore Vodafone piuttosto che proseguire con il nuovo operatore, elemento necessario al fine di provare la sussistenza del danno eventualmente causato.     In un contesto del genere e in un mercato caratterizzato da una pluralità di operatori (e non solo dai due, parti nel presente giudizio), il tribunale ritiene che non sia possibile stabilire se e in quale misura gli utenti, se informati correttamente sui costi effettivamente applicati al momento del ricevimento del messaggio, sarebbero rimasti con il nuovo operatore Iliad. Si evidenzia, peraltro, che l’eventuale passaggio da un operatore all’altro non si realizza al momento della recezione del messaggio, ma solo a seguito della sottoscrizione di un contratto, in cui l’utente viene informato dei costi effettivamente applicati.
Alla luce di tale motivazione, non può essere accolta la richiesta di rimessione in termini proposta da Iliad per il deposito della documentazione reperita a seguito dell’accesso integrale degli atti del procedimento AGCM, essendo essa irrilevante ai fini del decidere, con conseguente stralcio dei documenti di cui è stato autorizzato il deposito in data 18.02.2022 e di quelli depositati da parte attrice all’udienza di precisazione delle conclusioni del 17.05.2022>>.

Rigettata pure la domanda di  concorrenza skleale per ritartdato trasferimento del numero in base alla discipliona della number portabilility.

Circa  la  pubblicazione della setenzna:

<<Si osserva, infatti, in particolare, alla luce dei principi espressi dalla Suprema Corte, che la pubblicazione in uno o più giornali della sentenza, che accerti atti di concorrenza sleale, ai sensi dell’art. 2600 c.c., costituisce una misura discrezionale non collegata all’accertamento del danno, trattandosi di una sanzione autonoma, diretta a portare a conoscenza del pubblico la reintegrazione del diritto offeso (cfr. Cass. 11362/2022), potendo essere disposta anche dopo che il concorrente abbia cessato la propria attività (cfr. Corte d’Appello di Milano, 14.04.2011).

Alla luce di ciò, il tribunale ordina la pubblicazione della sentenza (intestazione + dispositivo) a spese di Vodafone Spa entro il termine di 30 giorni dalla comunicazione della presente sentenza, per una volta, a caratteri doppi del normale e con i nomi delle parti in grassetto, sul quotidiano il “Sole 24 ore”, con facoltà, per parte attrice di provvedervi direttamente in caso di inottemperanza della parte convenuta, recuperando successivamente le relative spese (cfr. Tribunale di Milano, sent. n. 5732/2016, 9.05.2016, est. Tavassi).
Il Collegio ritiene di non dovere accogliere la richiesta di pubblicazione della sentenza mediante inserzione sul sito ufficiale di Vodafone Italia S.p.A., su tutte le pagine ufficiali di Vodafone Italia S.p.A. presenti sui social network, su lettere da inviare a tutti i canali distributivi e a tutta la grande distribuzione e distribuzione organizzata, atteso che l’interesse di parte attrice risulta, allo stato, già soddisfatto in considerazione di quanto sopra disposto in ordine alla pubblicazione dell’intestazione e del dispositivo della sentenza sul quotidiano il “Sole 24 Ore”>>.

In G.U.C.E. il nuovo regolamento UE sulle indicazioni geografiche per prodotti artigianali e industriali

in GUCE odierna (serie L, n. 2023/2041 con la nuova modalità di pubblicazione “atto per atto”; v. ilcaso.it) il “Regolamento (UE) 2023/2411 del Parlamento europeo e del Consiglio, del 18 ottobre 2023, relativo alla protezione delle indicazioni geografiche per i prodotti artigianali e industriali e che modifica i regolamenti (UE) 2017/1001 e (UE) 2019/1753” .

Avevo postato in settembre il link ad una prima bozza,

L’atto  è importante.

La norma centrale è quella sulla protezione, art. 40 (oltre alle definizioni iniziali, naturalmente)

Poi ricordo:

  • principio della porta aperta per le associazioni di produttori, art. 45;
  • invocabilità come anteriorità nelle ADR sull’assegnazione dei nomi di dominio (entro la UE),. art. 46;
  • l’usabilità del simbolo IGP dell’Unione (v. allegati al reg. UE 664/2014);
  • è insufficientemente precisa la regola per cui la protezione si applica anche “alle merci vendute mediante la vendita a distanza, come il commercio elettronico” (art. 40.4.b): sembra mancare ogni criterio di localizzazione territoriale entro la UE (non potendosi pensare ad una applicazione extraterritoriale mondiale).

Curioso è che siano protetti anche i prodotti industriali (e non solo quelli artigianali): cioè pure quelli “realizzati in modo standardizzato, compresa la produzione in serie e mediante l’uso di macchine” (art. 4 sub 1.b; la precedente definizione sub 1.a) pare definire infatti la artigianalità).       La reputazione legata al luogo (art. 6) rimane anche quando si passa alla produzione automatizzata/seriale?

Copyright e standards

La corte di appello del distretto di Columbia , 12.09.2023, No. 22-7063, AMERICAN SOCIETY FOR TESTING AND MATERIALS, ET AL v. PUBLIC.RESOURCE.ORG, INC., dà qualche interessante insegnamento sul tema (qui la pagina della corte mentre  qui il link diretto al pdf).

Tre organizzazioni, che predispongno standard per certi settori di impresa, fanno causa a public.resource.org, per aver pubblicato centinaia di standards: il che violerebbe il copyright su di essi gravante.

Di questi la maggior parte era anche stata inserita (incorporate) nella legislazione usa.

La corte di appello dice che tale pubblicaizone da parte di https://public.resource.org/ costituisce fair use (per la parte incorporated).

I primi tre fattori del 17 us code § 107 sono a favore del convenuto.

L’ultimo (effetti economici sul mercato dell’opera protetta) è invece incerto: ma non basta a controbilanciare gli altri tre.

<<n ASTM II, we noted that Public Resource’s copying may harm the market for the plaintiffs’ standards, but we found the extent of any such harm to be unclear. 896 F.3d at 453. We noted three considerations that might reduce the amount of harm: First, the plaintiffs themselves make the incorporated standards available for free in their reading rooms. Second, Public Resource may not copy unincorporated standards—or unincorporated portions of standards only partially incorporated. Third, the plaintiffs have developed and copyrighted updated versions of the relevant standards, and these updated versions have not yet been incorporated into law. We asked the parties to address these issues, among others, on remand. See id.
The updated record remains equivocal. The plaintiffs press heavily on what seems to be a common-sense inference: If users can download an identical copy of an incorporated standard for free, few will pay to buy the standard. Despite its intuitive appeal, this argument overlooks the fact that the plaintiffs regularly update their standards—including all 185 standards at issue in this appeal. And regulators apparently are much less nimble in updating the incorporations. So, many of the builders, engineers, and other regular consumers of the plaintiffs’ standards may simply purchase up-to-date versions as a matter of course. Moreover, some evidence casts doubt on the plaintiffs’ claims of significant market injury. Public Resource has been posting incorporated standards for fifteen years. Yet the plaintiffs have been unable to produce any economic analysis showing that Public Resource’s activity has harmed any relevant market for their standards. To the contrary, ASTM’s sales have increased over that time; NFPA’s sales have decreased in recent years but are cyclical with publications; and ASHRAE has not pointed to any evidence of its harm. See ASTM III, 597 F. Supp. 3d at 240.
The plaintiffs’ primary evidence of harm is an expert report opining that Public Resource’s activities could put the plaintiffs’ revenues at risk. Yet although the report qualitatively describes harms the plaintiffs could suffer, it makes no serious attempt to quantify past or future harms. Like the district court, we find it “telling” that the plaintiffs “do not provide any quantifiable evidence, and instead rely on conclusory assertions and speculation long after [Public Resource] first began posting the standards.” ASTM III, 597 F. Supp. 3d at 240.
Finally, our analysis of market effects must balance any monetary losses to the copyright holders against any “public benefits” of the copying. Oracle, 141 S. Ct. at 1206. Thus, even if Public Resource’s postings were likely to lower demand for the plaintiffs’ standards, we would also have to consider the substantial public benefits of free and easy access to the law. As the Supreme Court recently confirmed: “Every citizen is presumed to know the law, and it needs no argument to show that all should have free access” to it. Georgia v. Public.Resource.Org., Inc., 140 S. Ct. 1498, 1507 (2020) (cleaned up)>>.

Sintesi sul quarto:

<<We conclude that the fourth fair-use factor does not significantly tip the balance one way or the other. Common sense suggests that free online access to many of the plaintiffs’ standards would tamp down the demand for their works. But there are reasons to doubt this claim, the record evidence does not strongly support it, and the countervailing public benefits are substantial.>>

Sintesi comlpèessiva: <<In sum, the first three factors under section 107 strongly favor fair use, and the fourth is equivocal. We thus conclude that Public Resource’s non-commercial posting of incorporated standards is fair use>>

Altro rigetto di registrazione come marchio per la suola Birkenstock

Marcel Pemsel su IPKat comunica la decisione del Bundespatentgericht 21 agopsto 2023 che il pattern trademark (marchi costiotuiti da motivi ripetuti o seriali) de quo manca di distintività, confondendosi copn ll’aspetto tipico delle suole di calzari (purtroppo decisione in tedesco)

Altra azione contro società di A. I., basata su diritto di autore: Concord Music, Universal Music e altri c. Anthropic PBC

Tramite il modello AI chiamato Claude2, Anthropic violerebbe il copyright di molte canzoni (della loro parte letterariA) . Così la citazione in giudizio da parte di molti produttori (tra i maggiori al mondo, parrebbe).

Ne dà notizia The Verge oggi 19 ottobre (articolo di Emilia David), ove trovi pure il link all’atto introduttivo di citazione in giudizio.

Riposto solo i passi sul come fuinziona il traininig e l’output di Claude2 e poi dove stia la vioalzione.

<<6 . Anthropic is in the business of developing, operating, selling, and licensing AI technologies. Its primary product is a series of AI models referred to as “Claude.” Anthropic builds its AI models by scraping and ingesting massive amounts of text from the internet and potentially other sources, and then using that vast corpus to train its AI models and generate output based on this copied text. Included in the text that Anthropic copies to fuel its AI models are the lyrics to innumerable musical compositions for which Publishers own or control the copyrights, among countless other copyrighted works harvested from the internet. This copyrighted material is not free for the taking simply because it
can be found on the internet. Anthropic has neither sought nor secured Publishers’ permission to use their valuable copyrighted works in this way. Just as Anthropic does not want its code taken without its authorization, neither do music publishers or any other copyright owners want their works to be exploited without permission.
7.
Anthropic claims to be different from other AI businesses. It calls itself an AI “safety and research” company, and it claims that, by training its AI models using a so-called “constitution,” it ensures that those programs are more “helpful, honest, and harmless.” Yet, despite its purportedly principled approach, Anthropic infringes on copyrights without regard for the law or respect for the creative community whose contributions are the backbone of Anthropic’s infringing service.
8.
As a result of Anthropic’s mass copying and ingestion of Publishers’ song lyrics, Anthropic’s AI models generate identical or nearly identical copies of those lyrics, in clear violation of Publishers’ copyrights. When a user prompts Anthropic’s Claude AI chatbot to provide the lyrics to songs such as “A Change Is Gonna Come,” “God Only Knows,” “What a Wonderful World,” “Gimme Shelter,” “American Pie,” “Sweet Home Alabama,” “Every Breath You Take,” “Life Is a Highway,” “Somewhere Only We Know,” “Halo,” “Moves Like Jagger,” “Uptown Funk,” or any other number of Publishers’ musical compositions, the chatbot will provide responses that contain all or significant portions of those lyrics>>.

<<11. By copying and exploiting Publishers’ lyrics in this manner—both as the input it uses to train its AI models and as the output those AI models generate—Anthropic directly infringes Publishers’ exclusive rights as copyright holders, including the rights of reproduction, preparation of derivative works, distribution, and public display. In addition, because Anthropic unlawfully enables, encourages, and profits from massive copyright infringement by its users, it is secondarily liable for the infringing acts of its users under well-established theories of contributory infringement and vicarious infringement. Moreover, Anthropic’s AI output often omits critical copyright management information regarding these works, in further violation of Publishers’ rights; in this respect, the composers of the song lyrics frequently do not get recognition for being the creators of the works that are being distributed. It is unfathomable for Anthropic to treat itself as exempt from the ethical and legal rules it purports to embrace>>

Come funziona il training di AI:

<<54. Specifically, Anthropic “trains” its Claude AI models how to generate text by taking the following steps:
a.  First, Anthropic copies massive amounts of text from the internet and potentially other sources. Anthropic collects this material by “scraping” (or copying or downloading) the text directly from websites and other digital sources and onto Anthropic’s servers, using automated tools, such as bots and web crawlers, and/or by working from collections prepared by third parties, which in turn may have been harvested through web scraping. This vast collection of text forms the input, or “corpus,” upon which the Claude AI model is then trained.
b.   Second, as it deems fit, Anthropic “cleans” the copied text to remove material it perceives as inconsistent with its business model, whether technical or subjective in nature (such as deduplication or removal of offensive language), or for other  reasons.
In most instances, this “cleaning” process appears to entirely ignore copyright infringements embodied in the copied text.
c.   Third, Anthropic copies this massive corpus of previously copied text into computer memory and processes this data in multiple ways to train the Claude AI models, or establish the values of billions of parameters that form the model. That includes copying, dividing, and converting the collected text into units known as “tokens,” which are words or parts of words and punctuation, for storage. This process is referred to as “encoding” the text into tokens. For Claude, the average token is about 3.5 characters long.4
d.   Fourth, Anthropic processes the data further as it “finetunes” the Claude AI model and engages in additional “reinforcement learning,” based both on human feedback and AI feedback, all of which may require additional copying of the collected text.
55.   Once this input and training process is complete, Anthropic’s Claude AI models generate output consistent in structure and style with both the text in their training corpora and the reinforcement feedback. When given a prompt, Claude will formulate a response based on its model, which is a product of its pretraining on a large corpus of text and finetuning, including based on reinforcement learning from human feedback. According to Anthropic, “Claude is not a bare language model; it has already been fine-tuned to be a helpful assistant.”5 Claude works with text in the form of tokens during this processing, but the output is ordinary readable text>>.

Violazioni:

<<56.
First, Anthropic engages in the wholesale copying of Publishers’ copyrighted lyrics as part of the initial data ingestion process to formulate the training data used to program its AI models.
57.
Anthropic fuels its AI models with enormous collections of text harvested from the internet. But just because something may be available on the internet does not mean it is free for Anthropic to exploit to its own ends.
58.
For instance, the text corpus upon which Anthropic trained its Claude AI models and upon which these models rely to generate text includes vast amounts of Publishers’ copyrighted lyrics, for which they own or control the exclusive rights.
59.
Anthropic largely conceals the specific sources of the text it uses to train its AI models. Anthropic has stated only that “Claude models are trained on a proprietary mix of publicly available information from the Internet, datasets that we license from third party businesses, and data that our users affirmatively share or that crowd workers provide,” and that the text on which Claude 2 was trained continues through early 2023 and is 90 percent English-language.6 The reason that Anthropic refuses to disclose the materials it has used for training Claude is because it is aware that it is copying copyrighted materials without authorization from the copyright owners.
60.
Anthropic’s limited disclosures make clear that it has relied heavily on datasets (e.g., the “Common Crawl” dataset) that include massive amounts of content from popular lyrics websites such as genius.com, lyrics.com, and azlyrics.com, among other standard large text
collections, to train its AI models.7
61.
Moreover, the fact that Anthropic’s AI models respond to user prompts by generating identical or near-identical copies of Publishers’ copyrighted lyrics makes clear that Anthropic fed the models copies of those lyrics when developing the programs. Anthropic had to first copy these lyrics and process them through its AI models during training, in order for the models to subsequently disseminate copies of the lyrics as output.
62.
Second, Anthropic creates additional unauthorized reproductions of Publishers’ copyrighted lyrics when it cleans, processes, trains with, and/or finetunes the data ingested into its AI models, including when it tokenizes the data. Notably, although Anthropic “cleans” the text it ingests to remove offensive language and filter out other materials that it wishes to exclude from its training corpus, Anthropic has not indicated that it takes any steps to remove copyrighted content.
63.
By copying Publishers’ lyrics without authorization during this ingestion and training process, Anthropic violates Publishers’ copyrights in those works.
64.
Third, Anthropic’s AI models disseminate identical or near-identical copies of a wide range of Publishers’ copyrighted lyrics, in further violation of Publishers’ rights.
65.
Upon accessing Anthropic’s Claude AI models through Anthropic’s commercially available API or via its public website, users can request and obtain through Claude verbatim or near-verbatim copies of lyrics for a wide variety of songs, including copyrighted lyrics owned and controlled by
Publishers. These copies of lyrics are not only substantially but strikingly similar to the original copyrighted works>>

<<70.
Claude’s output is likewise identical or substantially and strikingly similar to Publishers’ copyrighted lyrics for each of the compositions listed in Exhibit A. These works that have been infringed by Anthropic include timeless classics as well as today’s chart-topping hits, spanning a range of musical genres. And this represents just a small fraction of Anthropic’s infringement of Publishers’ works and the works of others, through both the input and output of its AI models.
71.
Anthropic’s Claude is also capable of generating lyrics for new songs that incorporate the lyrics from existing copyrighted songs. In these cases, Claude’s output may include portions of one copyrighted work, alongside portions of other copyrighted works, in a manner that is entirely inconsistent and even inimical to how the songwriter intended them.
72.
Moreover, Anthropic’s Claude also copies and distributes Publishers’ copyrighted lyrics even in instances when it is not asked to do so. Indeed, when Claude is prompted to write a song about a given topic—without any reference to a specific song title, artist, or songwriter—Claude will often respond by generating lyrics that it claims it wrote that, in fact, copy directly from portions of Publishers’ copyrighted lyrics>>.

<<80.
In other words, Anthropic infringes Publishers’ copyrighted lyrics not only in response to specific requests for those lyrics. Rather, once Anthropic copies Publishers’ lyrics as input to train its AI models, those AI models then copy and distribute Publishers’ lyrics as output in response to a wide range of more generic queries related to songs and various other subject matter>>.