- L’incompatibilité de l’exception de fouille de textes et de données avec le triple test pour la génération d’informations/œuvres
Un des premiers leviers de compensation envisageable consisterait à repenser l’exception de fouille de textes et de données qui, pour l’heure, ne comporte pas de mécanisme compensatoire afin de lui en adjoindre un. A cet effet, un argumentaire se développe pour contester la conformité de l’exception de fouille de textes et de données envisagée à l’article 4 de la directive DAMUN, au regard du test en trois étapes. Toutefois, il semble que les arguments relatifs à l’incompatibilité de l’exception avec l’exploitation normale ou l’absence de préjudice injustifié manquent partiellement leur cible (1.1.) si elles ne sont pas préalablement contextualisées à l’aune de la première condition du test, à savoir l’existence d’un cas spécial qui, pour la génération d’informations équipollentes à des œuvres par les IA génératives, fait défaut (1.2.).
1.1. La critique non concluante de l’exception de fouille au regard des deux dernières conditions du test en trois étapes.
L’opt out et la préservation de l’exploitation normale
« Opt out sur l’input ». Une première défense contre l’utilisation gratuite des contenus lors du moissonnage des contenus par les systèmes d’IA consiste à actionner la possibilité d’un opt out prévue dans l’exception de « TDM », c’est-à-dire de manifester une décision de refus et d’ainsi rendre indisponible à la fouille de données les œuvres protégées. C’est ce que vient de faire notamment la SACEM[8], qui entend ainsi signifier que l’accès à son répertoire ne pourra se faire librement mais devra faire l’objet d’une négociation. L’opt out serait par conséquent l’étape préalable au retour du droit exclusif et aux sources de rémunération y afférentes. La solution, séduisante en apparence, pose néanmoins de nombreuses questions notamment quant à sa généralisation et aux modalités de sa mise en œuvre, (quelles procédures ? quels outils ?) mais surtout ouvre la possibilité que les entraînements se fassent finalement sur des datasets ne comportant pas lesdites œuvres, ou à partir de pays qui ne reconnaissent pas de protection privant ainsi les IA des répertoires français ou européens, ou privant les acteurs français de l’IA d’opportunités de développement alors que les Etats-Unis, le Japon ou l’Angleterre n’ont pas envisagé de telles limites au TDM. Ainsi, d’un point de vue purement économique, l’exercice de l’opt out est loin d’assurer des chances de gains pour les ayants droit, même si la perspective d’une négociation monétaire pour lever les oppositions est bien entendu privilégiée par ces derniers.
Non-conformité au test en trois étapes de l’exception de TDM pour les IA génératives. Exploitation normale et opt out. Un second argument consiste à contester la conformité de l’exception de TDM, utilisée pour les IA génératives avec le test en trois étapes. Est-il utile de rappeler que le législateur tant international (convention de Berne, ADPIC) qu’européen (directive 2001/29) conditionne la mise en place d’exceptions à la conformité avec le test en trois étapes ? Il faut, pour qu’elle soit recevable, que l’exception constitue un cas spécial, qu’elle ne porte pas atteinte à l’exploitation normale de l’objet protégé et qu’elle ne cause pas un préjudice injustifié aux intérêts légitimes des titulaires. Or, il est loisible de considérer que l’article 4 de la DAMUN qui introduit une exception pour la fouille de textes et de données ne répond pas à ces trois conditions.
Toutefois, l’atteinte à l’exploitation normale n’est pas la plus évidente à démontrer. En effet, certains auteurs autorisés dont Martin Senftelben[9] font valoir que, précisément, la capacité d’opt out, en mettant les titulaires en capacité de se réserver le marché par le mécanisme d’opposition permet d’empêcher qu’une telle atteinte ne se réalise. D’autres font valoir que ce type de traitement ne correspond pas à une exploitation de l’objet protégé qui rentre « normalement » dans les marchés investis par les titulaires. Encore que cette lecture soit contestable dans la mesure où elle suppose que les ayants droit ne puissent pas intervenir sur des marchés nouveaux de ce type, ce que rien n’interdit. Elle est également démentie par la capacité d’opt out, qui inscrit justement dans le périmètre du monopole, les actes de fouilles de données dès lors que le titulaire manifeste sa volonté de les y inscrire.
Le caractère minime au non du préjudice
Non-conformité au test en trois étapes de l’exception de TDM pour les IA génératives. Absence de compensation. Une autre voie de contestation de la conformité du test en trois étapes s’appuie sur le préjudice injustifié que l’activité cause aux titulaires. L’absence de compensation économique pour l’exception en serait le signe. Le raisonnement consiste alors à considérer que pour les fouilles de textes et de données qui sont le préalable à la génération de succédanés d’œuvres, l’absence de rémunération prive injustement les titulaires d’une compensation en raison du préjudice subi par eux du fait de la concurrence de ces ersatz sur le marché des résultats produits. L’idée est intéressante mais elle suscite deux séries d’objections ; d’une part, elle place la question de la compensation sur le marché aval de celui qui concerne l’exception ; d’autre part, elle sollicite l’interprétation des textes européens puisque le considérant 17 de la DAMUN prévoit que « Compte tenu de la nature et l’étendue de l’exception, qui est limitée aux entités qui font de la recherche scientifique, le préjudice potentiel que cette exception pourrait occasionner aux titulaires de droits serait minime. Les États membres ne devraient, dès lors, pas prévoir de compensation pour les titulaires de droits en ce qui concerne les utilisations relevant des exceptions en matière de fouille de textes et de données introduites par la présente directive. » La seconde phrase semble en effet exclure la possibilité de prévoir de telles compensations pour les deux exceptions de TDM prévues dans la directive, à savoir celle qui envisage la fouille à des fins de recherche scientifique (article 3) et celle qui envisage l’exception à des fins de fouille (article 4).
La seconde objection n’est cependant pas dirimante car, à y regarder de plus près, l’assomption de préjudice potentiel minime de nature à refouler la compensation s’appuie sur la limitation de l’exception aux entités qui font de la recherche scientifique et donc à la seule hypothèse de l’article 3. Il serait possible de défendre par une interprétation a contrario l’idée que précisément, lorsque la finalité n’est pas celle de la recherche et que les entités bénéficiaires ne sont pas les seuls établissements de recherche, le préjudice ne serait pas minime et devrait, par conséquent, justifier une compensation. Au demeurant, les travaux préparatoires de la directive démontrent que l’idée d’une telle compensation avait été émise s’agissant de la seconde exception de TDM, au contraire de la première. Ainsi, les Etats membres pourraient décider d’accompagner le dispositif de l’exception d’un système compensatoire lorsque le préjudice n’est pas minime.
Risques de l’approche. Le raisonnement est séduisant mais semble pourtant incomplet. Tout d’abord il faut se méfier des charmes de l’interprétation par a contrario dont on connaît les fragilités. Il ne saurait en effet être automatiquement déduit de cette logique que lorsque l’exception de TDM ne s’applique pas aux établissements de recherche, alors elle doit donner lieu à compensation parce que le préjudice n’est pas minime. Il serait plus juste d’ouvrir la voie à une probabilité en formulant l’hypothèse que, hors du champ de l’exception de TDM à des fins de recherche, le préjudice pourrait ne pas être minime, ce qui signifie qu’il serait loisible de distinguer au sein de l’article 4, les situations dans lesquelles le préjudice serait potentiellement substantiel de celles où elles seraient minimes. En effet, tous les travaux de fouille ne conduisent pas à générer des objets qui sont susceptibles de causer un préjudice injustifié aux titulaires de droit[10]. Si le produit de la fouille consiste, par exemple, à retracer l’onomastique proustienne dans le cadre d’une analyse de la Recherche du temps perdu par des amateurs inconditionnels du grand Marcel, on voit mal ce qui pourrait justifier qu’un tel traitement d’une œuvre (qui est par ailleurs est dans le domaine public) conduise à une compensation des titulaires de droit. Le résultat de la fouille, en l’occurrence l’apparition de constantes dans les textes constitue l’essence même du TDM et ne vient pas causer un préjudice aux titulaires car il s’apparente à une analyse intelligente et non à une exploitation de l’œuvre en tant que telle.
En outre, le mécanisme compensatoire ne pourrait être que global ; or, les objets de la fouille peuvent être ou non protégés par des droits de propriété intellectuelle. Les mécanismes de traitement moissonnent en effet des sommes colossales d’informations diverses et il semble bien difficile en leur sein de distinguer ce qui relève du champ de la protection par la propriété littéraire et artistique. Les appels à la transparence des datasets pourraient, s’ils sont entendus, aider à l’identification de la part marginale des contenus protégés dans les corpus fouillés mais il est très probable qu’alors, relativement, cette part apparaisse minime et que le préjudice le soit, par conséquent, aussi[11]. Ainsi, ni certaines formes de résultats, ni la part imputable aux titulaires d’objets protégés dans ces derniers n’assurent l’existence d’un préjudice suffisant. Si la piste de la non-conformité avec l’absence de préjudice injustifié n’est pas à exclure, elle doit être contextualisée et conduire à une nouvelle approche pour prendre en considération le seul cas particulier des IA génératives.
1.2. L’absence de conformité à la condition de cas spécial pour les extrants de l’IA générative équipollents à des œuvres
Non-conformité au test en trois étapes de l’exception de TDM pour les IA génératives. Absence de cas spécial. Selon moi, la voie la plus efficace pour contester la conformité du test en trois étapes de l’exception de fouille de textes et de données consiste à avancer qu’elle ne correspond pas à un cas spécial lorsque la finalité du traitement est de conduire à produire une information/œuvre. Au contraire de l’exception de l’article 3 qui associe la fouille à une finalité de recherche – la fouille est alors le moyen – l’exception de l’article 4 envisage la fouille comme étant la finalité. Comme son nom l’indique, l’article 4 instaure une exception « pour » la fouille de textes et de données. Le législateur européen a donc consacré la possibilité de reproduire ou d’extraire, sans autorisation préalable des titulaires, des œuvres et autres objets protégés accessibles de manière licite aux fins de la fouille de textes et de données. En d’autres termes, il s’agirait ici de fouiller pour fouiller puisque la fouille est à la fois le moyen et l’horizon. Cette logique circulaire pose un problème de délimitation de l’exception et, partant, de la conformité de celle-ci avec la première condition du test, l’existence d’un cas spécial.
Quel est, en principe, le cadre d’intervention de l’exception ? Comme il a été dit, la fouille est autorisée, selon le texte de l’article 2 paragraphe 2 de la directive, pour « rendre possible toute technique d’analyse automatisée visant à analyser des textes et des données sous une forme numérique afin d’en dégager des informations, ce qui comprend, à titre non exhaustif, des constantes, des tendances et des corrélations ». Or, l’absence de définition de la notion d’information ouvre la voie à toutes sortes de résultats, y compris à la possibilité de dégager ultimement des extrants équipollents à des « œuvres ». Pourtant, il faut, pour donner un sens utile, distinguer selon que « l’information » dégagée à l’issue de la fouille s’apparente par ses caractéristiques ou fonctionnalités à une œuvre ou à un autre objet protégé ou qu’elle ne s’y rattache nullement (information brute, formule mathématique…). On entend ici par « œuvre[12] » les créations relevant du domaine de la propriété intellectuelle mais qui pourraient ne pas être protégées, faute de réunir les autres conditions qui déclenchent l’application des droits exclusifs.
Le test en trois étapes sur le marché des extrants substituables aux œuvres et objets protégés par la PLA.Dans cette sous-hypothèse de l’exception, la fouille pourrait consister à analyser des œuvres protégées pour générer une information/œuvre. En poussant l’idée jusqu’à l’absurde, on peut imaginer qu’un procédé d’analyse automatique d’une œuvre conduise à générer une information qui n’est rien d’autre que la reconstitution parfaite de l’œuvre en même. Le procédé d’analyse consisterait ici à générer, in fine, un résultat copie exacte du modèle, tout en développant un moyen technique innovant. Dans ce cas limite, la fouille n’apparaitrait plus que comme un procédé de reproduction comme un autre qu’aucune finalité extérieure à la copie ne vient justifier. Il nous paraît donc possible d’énoncer qu’un procédé de fouille d’œuvres dont la finalité serait de générer des « informations/œuvres » ne répondrait pas à la condition de cas spécial puisqu’elle ouvrirait la voie à n’importe quel usage de l’œuvre produite au simple motif qu’elle aurait été « dégagée » au terme d’une analyse automatisée.
On peut, à cette proposition, opposer deux critiques. La première consiste à rétorquer que les extrants générés par les IA ne sont pas des œuvres. La seconde à souligner que le résultat de la fouille n’est jamais de générer une information similaire à une œuvre car une ou plusieurs opérations algorithmiques intermédiaires sont nécessaires pour parvenir à un tel résultat. S’agissant de la première objection, rien n’empêche de considérer que la relation de l’œuvre à l’information ou à la donnée soit bijective. Si l’œuvre est traitée comme une information en tant qu’elle fait l’objet de la fouille, on pourrait en déduire que « l’information » produite par la fouille puisse s’apparenter également à une œuvre, certes une « œuvre » non protégée mais à une information qui prend la forme d’une œuvre. S’agissant de la seconde, elle peut être écartée au titre d’une vision fonctionnelle d’ensemble du processus de traitement.
Des extrants/œuvres ou équipollents aux œuvres. Assimiler certains extrants à des œuvres est un pas théorique qui, à la réflexion, ne s’avère pas si compliqué à franchir. Il consiste à s’appuyer sur la distinction, souvent méconnue par la jurisprudence, entre la notion d’œuvre en tant que catégorie potentiellement éligible à la protection au regard de ses caractéristiques objectives et celle d’œuvre protégée qui remplit, par d’autres critères, les conditions de déclenchement du statut légal. La Cour de Justice a fait le départ entre deux critères celui de la création intellectuelle propre et la nécessité de précision suffisante dans l’expression d’une forme[13]. Ainsi une œuvre peut échouer à obtenir une protection parce que les juges estiment qu’en dépit de son appartenance au domaine de la création « littéraire et artistique », elle ne présente pas les autres caractéristiques requises pour être protégée : absence de création par une personne physique, absence d’originalité, etc. Il y a bien des œuvres dont la protection est refusée en raison de cette absence et elles n’en perdent pas la qualité d’œuvres pour autant. En d’autres termes, un extrant généré par une IA ne pourrait jamais acquérir la protection, faute d’intervention humaine décisive, sans que pour autant on doive nécessairement refouler l’assimilation de ces productions à une « œuvre ».
L’hypothèse d’un résultat généré par la fouille équipollente à une œuvre. Au demeurant, il n’est peut-être pas nécessaire de pousser l’usage de ce vocabulaire puisque ce qui importe est l’existence d’un effet substitutif sur le marché. Même s’il n’est pas une « œuvre », l’extrant généré par l’IA en présente les caractéristiques de forme, se prête à un usage similaire et est, par conséquent, susceptible de remplacer l’œuvre par un ersatz, succédané, comme il plaira de le nommer, qui d’un point de vue économique porte atteinte au marché de l’exploitation. Le problème posé par les IA génératives dans le champ du droit d’auteur ne concerne pas principalement les « outputs » qui ne ressemblent pas à des œuvres mais bien ceux qui entrent dans ce domaine. Il convient donc de circonscrire l’application du test en trois étapes à cette seule hypothèse. La revendication des titulaires ne saurait aller jusqu’à imposer un mécanisme d’autorisation préalable sur n’importe quel type de traitement de fouille, quel que soit le résultat de l’analyse, au seul motif qu’un acte de reproduction intervient à un moment ou un autre dans la chaîne des traitements[14].
Le refoulement du monopole sur le traitement documentaire des œuvres. En outre, la jurisprudence française s’est déjà refusée à inclure dans le périmètre du droit de reproduction certaines opérations de traitement purement technique des œuvres n’ayant pas de conséquence sur le marché de l’exploitation de celles-ci. C’était il y a déjà fort longtemps déjà, dans des arrêts Microfor restés célèbres[15]. Dans le premier arrêt, la Cour de cassation avait jugé que l’article 40 de la loi du 11 mars 1957 (actuel article L. 122-4 du code de la propriété intellectuelle) « n’est pas applicable à l’édition, par quelque moyen que ce soit, d’un index d’œuvres permettant de les identifier par des mots-clefs » ; et qu’il ne s’appliquait pas davantage à « l’analyse purement signalétique réalisée dans un but documentaire, exclusive d’un exposé substantiel du contenu de l’œuvre, et ne permettant pas au lecteur de se dispenser de recourir à cette œuvre elle-même». L’arrêt d’Assemblée plénière rendu en 1987 avait, quant à lui énoncé dans un attendu de principe, que « si le titre d’un journal ou d’un de ses articles est protégé comme l’œuvre elle-même, l’édition à des fins documentaires, par quelque moyen que ce soit, d’un index comportant la mention de ces titres en vue d’identifier les œuvres répertoriées ne porte pas atteinte au droit exclusif d’exploitation par l’auteur. » La Cour de cassation a donc établi, de manière solennelle, que les pratiques d’indexation ne rentraient pas dans le champ d’application du droit exclusif, même si l’ajout par l’Assemblée plénière de la condition d’« édition à des fins documentaires » ouvre la possibilité de nuancer la solution. Il semble donc difficile de défendre que les traitements de fouille qui conduisent effectivement à l’établissement de simples informations d’analyse entrent systématiquement dans le périmètre du droit exclusif.
Test concurrentiel. En réalité, ce qui transparaît de cette jurisprudence c’est l’existence d’un test concurrentiel sous-jacent entre le produit de l’analyse et le marché de l’œuvre objet de l’analyse. Pour les juges, lorsque le produit de l’analyse se substitue à la consultation de l’œuvre d’origine, en dispensant le lecteur de s’y rendre et en reprenant un exposé « substantiel » de celle-ci, elle rentre dans le cadre de l’autorisation préalable. En revanche, si elle ne remplit pas ce rôle substitutif, elle n’a pas à être autorisée par le titulaire de l’œuvre objet de l’analyse. C’est d’ailleurs au terme d’une tel raisonnement que la Cour d’appel de Paris avait rejeté l’application du droit d’auteur à l’encontre des moteurs d’image, dès lors que le résultat du traitement était le moyen d’opérer la recherche d’une image[16] et que la reprise des images sous forme de vignettes n’excédait pas ce qui est nécessaire à cette fonction de l’outil. Il est vrai que, depuis lors, la directive 2001/29 a donné du droit de reproduction une définition très vaste couvrant toutes les formes de reproduction, droit que l’exception obligatoire de copie provisoire transitoire avait précisément pour objet de juguler pour certains traitements automatiques. A ce titre, on peut relever que cette exception, susceptible de justifier certaines pratiques de fouille, met en place une condition d’absence d’intérêt économique propre de la copie qui délimite précisément l’hypothèse dans laquelle le service rémunéré se place sur un terrain différent de celui de l’exploitation de l’œuvre[17].
Approche économique d’ensemble. S’agissant de l’objection technique, elle est certes recevable dans la mesure où les processus de traitement de l’information effectués par un système d’IA, même dite générative, supposent une succession d’actions et d’acteurs qui cadrent mal avec une approche linéaire du mécanisme. On peut arguer qu’il y a loin de la fouille à la génération de contenus par les IA et que plusieurs opérations intermédiaires sont nécessaires pour accomplir le chemin, de sorte que cette fouille préparatoire ne serait qu’une étape dans le processus final de « génération » de l’extrant dont il faudrait la distinguer. Il semble pourtant que l’argument puisse être dépassé au titre d’une approche « inversée » de l’opération. Il s’agit en effet d’envisager l’exception de fouille du point de vue du droit d’auteur uniquement dans l’hypothèse où l’opérateur générant un contenu équipollent à une œuvre a pu le faire grâce à des données d’entraînement qui contiennent des œuvres ou autres objets protégés. L’opération économique et l’ingénierie contractuelle permettent de chaîner les opérations et de remonter d’une opération à l’autre pour assurer qu’un lien suffisant existe entre l’amont (la fouille) et l’aval (l’extrant équipollent à une œuvre).
Distinction de l’exception selon la destination de la fouille. Ainsi, c’est au regard de la destination finale du traitement que pourrait se faire le départ entre deux sous catégories de régimes : l’exception de TDM demeure gratuite lorsque l’analyse par des outils d’IA vise à fournir des informations qui ne sont pas substitutives des œuvres ou autres objets protégés ; si, en revanche l’analyse est destinée à générer des quasi-œuvres, quand bien même cette génération suppose des opérations subséquentes, elle ne correspond pas à un cas spécial, faute de déterminer un cadre d’intervention précis, différent de l’exploitation de l’œuvre elle-même ou de ses formes dérivées. Or, si la condition de cas spécial n’est pas remplie, l’exception ne peut être mise en œuvre et on retourne au droit exclusif.
Au terme de cette démonstration, il est donc loisible d’exposer l’hypothèse suivante : l’exception de fouille actuelle ne peut pas passer le test en trois étapes dans le cas où l’analyse à laquelle il est procédé conduit, in fine, à la génération d’extrants équipollents à des œuvres. Tel est bien le cas des AI dites génératives dont la définition figurant dans la proposition de règlement IA les appréhende comme des systèmes « destinés spécifiquement à générer, avec différents niveaux d’autonomie, des contenus tels que des textes, des images, des contenus audio ou des vidéos complexes (IA générative). » Dès lors que cette génération a nécessité en amont une reproduction d’œuvres protégées, le lien de causalité suffisant est constitué pour faire vaciller l’exception car la fouille contribue à la réalisation du préjudice.
Cantonnement de l’exception de TDM aux hypothèses dans lesquelles le résultat produit n’est pas équipollent à une œuvre ou à un autre objet protégé. Dans la mesure où les trois conditions du test sont cumulatives, l’absence de conformité à la première condition– le cas spécial – pour une sous-catégorie des cas visés par l’exception de TDM de l’article 4, à savoir l’analyse automatisée d’œuvres pour produire des œuvres-informations suffit à questionner sa conformité. A suivre cette approche, le champ d’application de l’exception actuelle de fouille devrait être limité aux hypothèses dans lesquelles le moissonnage des œuvres conduit à la production d’informations qui ne sont pas équipollentes à des œuvres. En revanche, lorsque le traitement a pour finalité directe ou indirecte de générer des extrants équipollents à des œuvres ou autres objets protégés, l’exception ne serait pas recevable et le droit exclusif retrouverait son terrain d’élection. Il faudrait alors soit négocier des accords, soit écrire une nouvelle exception dédiée visant le cadre précis de la finalité de génération d’œuvres, laquelle pourrait s’accompagner d’une compensation équitable puisqu’il serait loisible alors de démontrer que la génération de ces quasi-oeuvres, en venant concurrencer l’exploitation des objets protégés cause aux titulaires un préjudice injustifié. De la sorte, on pourrait remédier à la razzia gratuite des contenus protégés qui alimente sans contrepartie les services de génération automatique de quasi-œuvres. Cette possibilité pourrait se faire sans préjudice d’un éventuel autre mécanisme venant appréhender le sort des extrants[18].


Laisser un commentaire