博鱼核心提示:北京互联网法院审理并宣判全国首起涉及人工智能生成声音的人格权侵权案件,明确认定在具备可识别性的前提下,自然人声音权益的保护范围可及于AI生成声音。这主要涉及自然人声音许可使用授权下的录音作品、声纹信息如何保护问题,并提出了AI声音的可识别性标准、规范AI化声音的授权使用问题。
4月23日,北京互联网法院审理并宣判全国首起涉及人工智能(以下简称AI)生成声音的人格权侵权案件。法院认定,四名被告存在过错博鱼(中国)官方网站-BOYU SPORTS,侵犯原告人格权,责令向原告赔偿经济损失共25万元。
该判决明确认定在具备可识别性的前提下博鱼(中国)官方网站-BOYU SPORTS,自然人声音权益的保护范围可及于AI生成声音。AI生成声音可识别性的认定应综合考虑行为人使用情况,并以相关领域普通听众能否识别作为判断标准。
自然人声音表达蕴含三层内容:一是可以通过声音识别出某个特定自然人,其所体现的人格利益与该自然人不可分,因而其具有人身属性。二是以自然人声音表达的特定内容,以某种载体呈现出来,如录音或音频,具有作品性质。三是自然人声音本身包含的可识别特征,如音色、音调、节奏、强度和发音方式等信息,这些特征让自然人声音具备可识别性,具有个人信息的属性。
相应地,对自然人声音的使用包括三种形式:一是自然人与外部社会交流时,用语言表达心里所想,是自然人内心意思的外在语言表现。二是自然人用体现自身特质的声音表现特定的内容,该内容可以是自己的作品,也可以是他人的作品,比如演唱或朗读。三是自然人声音蕴含的特征信息,被通过技术提取,用来验证自然人身份或用于AI化语音生成。
因此,对自然人声音的保护呈现三种途径:一是自然人声音与特定自然人关联。该声音具备人身性质,是人格权保护的内容。二是以自然人声音表现的特定内容。当它以某种载体的形式呈现出来时,成为声音作品,是著作权保护的内容。三是作为声纹信息,自然人的声音被现代科技采集与提取。当具有可识别特征的自然人声音,转化成为声纹信息时,其属于个人信息保护的内容。
北京互联网法院审理的AI生成声音人格权侵权案主要涉及两方面问题:自然人声音许可使用授权下的录音作品、声纹信息如何保护。
录音作品保护。《中华人民共和国民法典》第一千零二十三条规定,对自然人声音的保护参照适用肖像权的保护。这明确将声音权益作为特殊的人格利益予以保护。参照《民法典》第一千零一十八条的规定:“自然人享有肖像权,有权依法制作、使用、公开或者许可他人使用自己的肖像。肖像是通过影像、雕塑、绘画等方式在一定载体上所反映的特定自然人可以被识别的外部形象。”可见,自然人声音同自然人肖像一样,可以许可他人使用。需要注意的是,这里的许可他人使用是指,许可他人通过一定载体使用特定自然人声音所表达的内容。比如,文章开头提到的案件中原告接受委托为被告二录制系列录音制品,原告授权被告二使用以自己声音表达的内容。被告二拥有此录音制品著作权。
《中华人民共和国著作权法》第四十四条规定:“录音录像制作者对其制作的录音录像制品,享有许可他人复制、发行、出租、通过信息网络向公众传播并获得报酬的权利”。依照该规定,文章开头提到的案件中,被告二作为著作权人,仅拥有对原告录音制品表现形式的权利,并不拥有对原告声音样本包含的关键声音特征,如音色、音调、节奏、强度和发音方式等信息的使用权。因此,被告二无权授权被告三使用该录音制品中包含的声音信息进行AI化处理,并生成涉案文本转语音产品。被告二将该录音制品的音频提供给被告三,允许被告三以商业或非商业的用途使用、复制、修改数据用于其产品及服务,其中,“修改数据用于其产品及服务”的授权,已超越著作权的授权范围。
声纹信息保护。自然人的声音声纹,是对语音中所蕴含的、能表征和标识说话人的语音特征,以及基于这些特征(参数)所建立的语音模型的总称。声纹识别是根据待识别语音的声纹特征识别一段语音所对应的说话人的过程。声纹像指纹一样,没有两个人具有相同的声纹特征,它可以用来标识、解析、识别一个生物个体。因此,声音是自然人的生物信息。
首先,音色、音调、节奏、强度和发音方式等声音特征与自然人不可分,属于人格权保护的内容。其次博鱼(中国)官方网站-BOYU SPORTS,自然人声音中所包含的声纹信息具备可识别性,能以电子方式记录,能关联到唯一自然人。因此,它属于《中华人民共和国个人信息保护法》第四条规定的个人信息。该法第二十八条规定,敏感个人信息包括生物识别信息。国家市场监管总局与国家标准化管理委员会2020年发布的《信息安全技术 个人信息安全规范》明确,个人生物识别信息包括个人基因、指纹、声纹、掌纹、耳廓、虹膜、面部识别特征等。这些信息一旦泄露、非法提供或滥用可能危害人身和财产安全。由于声音中蕴含的声纹信息具备可识别性,属于个人生物识别信息,所以它也是敏感个人信息。按照《个人信息保护法》第二十八条、第二十九条的规定,处理敏感个人信息必须满足“具有特定的目的和充分的必要性,并采取严格保护措施的情形下”,且“应当取得个人的单独同意”。
前文所述案件中,被告二在未获取原告单独同意的情况下,与被告三签订修改录音作品数据用于其产品及服务内容的协议,授权被告三AI化使用原告声音的行为违反民法典、个人信息保护法的有关规定。被告三未经原告许可,以原告录制的录音制品作为素材采集原告声纹信息,进行特征分析与AI化处理,生成涉案文本转语音产品,并在被告四的云服务平台对外出售。该产品允许用户输入文本内容,并根据设定的参数将文本转换成语音输出。原告在朋友告知下,意外发现有模仿其声音的作品在多个知名App广泛流传。可见,生成式AI合成的声音已经使一般社会公众根据其音色、语调和发音风格,关联到原告本人,可以认定生成式AI合成的声音具有可识别性,侵犯原告的声音权益。《民法典》第一千零一十九条明确,任何组织或者个人不得利用信息技术手段伪造等方式侵害他人的肖像权。可见,被告二、被告三的行为已违反有关法律规定,侵犯原告的声音权益。
前文所述案件判决在确认声音权益属于人格权的同时,为AI技术在声音合成、模仿等方面的应用提供了规范。该判决不仅有效维护了原告的声音权益,也提升了大家对声音权益的保护意识,有利于引导AI技术朝着健康、合法方向发展,促进了技术合理利用。
建立AI声音的可识别性标准。通过对前述AI生成声音人格权侵权案的分析,我们可以发现,它提出了界定AI声音可识别性标准的问题博鱼(中国)官方网站-BOYU SPORTS。鉴于AI技术的特殊性,应制定AI生成声音的可识别性标准,以及如何通过技术手段鉴别AI生成声音与自然人声音的区别。可识别性标准要以一般公众或相关领域听众的识别能力为限度,包括音色、语调、节奏等特征的相似度。如果AI生成的声音足以使这些人将其与特定个人的声音联系起来,则认为具有可识别性。同时,引入声音识别专家或相关领域专家进行有效评估,为司法审判提供关于声音可识别性的客观意见。
规范AI化声音的授权使用。明确授权的范围和限制:在授权协议中详细列明授权的具体内容,包括声音作品的使用目的、使用范围、使用期限及是否允许对声音进行AI化处理。如允许对声音进行AI化处理,则要进一步设定AI声音使用的限制,比如禁止在色情内容或其他可能损害声音所属自然人名誉的特定情境下使用等。同时,应规定在AI声音合成技术中加入保护措施,如水印或独特标识博鱼(中国)官方网站-BOYU SPORTS,以便于区分AI生成的声音和原始声音。要求AI声音的使用者公开其使用AI声音的方式和目的,以增加公众监督。