近日,《纽约时报》报道, OpenAI和谷歌被指涉嫌使用YouTube视频的转录文本来训练其人工智能模型,这一行为可能侵犯了YouTube创作者的版权。
据报道,OpenAI通过使用其Whisper语音识别工具,转录了超过一百万小时的YouTube视频内容,并将这些数据用于训练其GPT-4模型。同时,谷歌也被曝出使用YouTube视频来训练自家的人工智能模型。然而,这两家公司的行为似乎并未得到所有创作者的授权。
如果可以随意使用创作者的公开内容进行AI训练,那么创作者的权益将如何得到保障?
“有意见”留言板
@媒体搬运工:大模型就像是“饕餮”,对于数据有着先天的嗜好,互联网上的论坛、贴吧、短视频等都是大模型眼中的“大餐”。对于这种可以抓取的信息,需要从法规上进行规范,而不是借助用户条款。
@辣腿堡不加酱:用于训练人工智能模型的这些数据来源是否可追溯,如果是公开展示的内容是否可直接用于训练,这些都需要进一步规范,而不是问及就含糊其辞
好文章,需要你的鼓励
在CTO Alex Smart带领下,Southern Cross旅游保险通过优化团队和架构,并利用AI等技术,于11个月内重塑核心保险平台,实现全方位数字转型,打造一致高效的客户体验。
前急诊科医生乔尔·克莱因凭借医疗现场经验转型为 University of Maryland 医疗系统的 CIO,推动 IT 创新,成功应对勒索病毒、疫情等挑战,并引入数字化手段改善手术室运作。
文章指出 SoundCloud 因服务条款更新引发争议,强调未用艺术家内容训练 AI,未来 AI 工具将助力音乐创作并保障版权。
Meta 正转变战略,研发新一代 AI 眼镜和耳机,这些设备将通过内置软件扫描周边人脸并识别姓名,同时更新隐私政策,引发技术伦理与隐私保护热议。