视频生成器Sora让人喜忧交加

发布时间:2024-04-30 00:41:52 来源: sp20240430

  继推出ChatGPT后,龙年伊始,OpenAI公司又推出了最新人工智能(AI)模型——文本-视频程序Sora。这款工具可根据简单的文本描述,生成类似好莱坞电影般的逼真而又充满想象力的视频。

  英国《新科学家》杂志网站在2月17日的文章中指出,对Sora的到来,人们可能“既爱又怕”。不少科学家欢呼其到来,认为它将进一步推动技术进步。但也有人担心,Sora会被别有用心之人用来制造深度伪造视频,加剧错误和虚假信息的泛滥。

两大技术孵化强大功能

  Sora日语意为“天空”,其背后的团队之所以选择这个名字,是因为它“让人联想到无限的创造潜力”。该系统是生成式AI的一个最新实例。生成式AI可即时创建文本、图像和声音。

  Sora目前可单独使用文本指令,或将文本与图像相结合,来创建长达60秒的视频,而且是一镜到底。比如一段演示视频依据如下文字描述生成:一位时尚女性漫步于充满城市标牌的东京街道上,道路两边霓虹灯闪烁,透出阵阵暖意。Sora不仅准确呈现了细节,还生成了具有丰富情感的角色。

  目前OpenAI官网上已更新了48个视频,包括一只狗在雪地里嬉戏,车辆在路上行驶,以及更奇幻的场景,如鲨鱼在城市摩天大楼之间游泳等。有专家认为,Sora的表现优于其他类似模型,标志着文本-视频技术的巨大飞跃。

  为实现更高水平的真实感,Sora结合了两种不同的AI技术。一是类似于DALL-E等AI图像生成器中使用的扩散模型,这些模型学习将随机图像像素转换为相干图像;二是“转换器架构”技术,其被用于将序列数据依据上下文内容拼接在一起。例如,大型语言模型使用转换器架构将零散的单词组装成人们可理解的句子。OpenAI将视频片段分解为视觉“时空补丁”,Sora的转换器架构可处理这些补丁。

  英伟达公司高级研究科学家范麟熙在社交媒体平台X上称,Sora是一个可模拟现实世界的“数据驱动的物理引擎”。

仍有诸多完善空间

  尽管Sora生成的视频令人印象深刻,但并非完美无缺。

  OpenAI公司坦承,目前Sora模型也有弱点。它可能难以准确模拟复杂场景的物理特性,且可能无法理解因果关系。例如,该系统最近生成了一个人吃饼干的视频,但饼干怎么吃也没变小,被咬的饼干也神奇地没有咬痕。此外,该模型还可能混淆文字提示的空间细节,也可能难以精确描述随时间推移发生的事件。

  美国普林斯顿大学的阿凡德·纳拉亚南指出,Sora生成的视频在描绘有大量动作的复杂场景时仍然会出现一些奇怪的小问题。

或使人真伪难辨

  除了加快经验丰富的电影制作人的工作速度外,Sora还可能快速廉价的制造网络虚假信息,使人们在互联网上更难分辨真伪。

  OpenAI公司仍在试图了解Sora的危险性,因此尚未向公众发布该系统。相反,他们正在与为数不多的学者和其他外部研究人员分享这项技术,希望借助这些专家的智慧,找到该系统可能被滥用的方式。

  OpenAI针对Sora开展的“红队”演习中,专家们试图破坏AI模型的保护措施,以评估其被滥用的可能性。OpenAI发言人表示,目前参与测试Sora的都是“在错误信息、仇恨内容和偏见等领域的专家”。

  这项测试至关重要,因为Sora可能会被别有用心者用来生成虚假视频,以骚扰他人,甚至影响政治选举。学术界、商界、政府以及AI专家都很担心,AI生成的“深度伪造”内容可能会造成虚假和错误信息的广泛传播。

  美国加州大学伯克利分校的哈尼·法里德认为,与生成式AI领域的其他技术一样,人们有理由相信,文本-视频技术会持续改进。因为一旦Sora与由AI驱动的语音克隆技术相结合,将为不怀好意者提供全新工具,并创建出逼真的深度伪造内容,这将让人们越来越难以区分真伪。

  OpenAI已经在该系统生成的视频中加上了水印,表明这些视频是由AI生成的。但该公司也承认,这些水印可被移除,水印可能难以被发现。

  OpenAI发言人强调称,在将Sora用于OpenAI的产品之前,该公司正在采取几项重要的安全措施。例如,该公司已使用了自动化流程,旨在防止其商业AI模型生成针对政客和名人的虚假内容。

(责编:张泰运、姜洁)
算力券撬动产业发展活力(经济新方位) - 经济形势理性看:深刻认识我国经济发展的底气、优势和机遇

算力券撬动产业发展活力(经济新方位)

发布时间:2024-04-30 00:41:53 来源: sp20240430

  晚上9点,贵州安顺经济技术开发区,南智云谷数字产业发展有限公司的机房里,蓝色指示灯闪烁不停,一排排高大的机柜传出嗡嗡声响。在恒温恒湿的环境中,服务器高速运转,源源不断输出算力。

  同一时刻,广东广州华新科创岛,光合未来科技文化传媒有限公司的办公楼灯火通明,键盘敲击与鼠标点击声此起彼伏。虚拟数字人、动漫游戏、人工智能短片……一幅幅炫目画面在电脑屏幕上闪烁,几十名工程师正加班加点赶制新订单的产品。

  相隔约1000公里,一张算力券把两个公司紧密连接。

  从去年开始,对算力保障要求颇高的人工智能相关业务日益火爆,自建数据中心成本太高,光合未来只得重金购买算力服务。“有客户希望3天内交出一部片子,但以我们既有的力量,一天也制作不出几秒钟素材。”眼看算力服务成了公司支出大头,面对源源不断找上门来的生意,公司首席执行官赵文俊感到有些为难。

  为了找到更具性价比的算力,赵文俊把目光投向了贵州——那里是全国首个国家级大数据综合试验区,也是全球集聚大型和超大型数据中心最多的地区之一,目前部署智算芯片累计超8万张,智能算力规模较2022年增长98倍,算力资源丰富。

  供给日益充沛的同时,如何激发使用需求?今年初,贵州推出算力券这一优惠政策,企业在购买贵州算力服务或数据交易产品时,可以抵扣一定比例费用,同一主体年度累计兑现额度最高可达200万元。

  政策驱动下,2月29日,光合未来成为首批领取算力券的72家企业之一,并与南智云谷签订合作协议。“公司全年购买算力服务有望达到1800万元,如果用上算力券,能节约54万元成本,实实在在减轻了负担。”赵文俊说,双方正紧密配合,抓紧履行算力券兑换手续,“终于可以放开手脚接订单,今年要努力让公司业绩翻一番。”

  光合未来在广东干得风生水起,南智云谷在贵州同样业务繁忙。“算力券是真金白银的激励,对中小企业吸引力尤其大,最近有10多家企业找我们谈合作。”公司董事长王刚介绍,自从算力券政策推出,各地有算力需求的客户纷纷找上门,公司一季度签约金额超1亿元,相当于去年全年的合同总额。

  在贵州大数据产业发展带动下,两年前,南智云谷建成云数据中心,具备满足大功率算力服务需求的能力,在保证本地边缘计算和低时延算力业务服务的同时,还可承接全国中高时延算力业务和数据异地容灾备份业务。“必须抓住机会,努力延伸和优化数据中心产业链,尽快构建从基础端到应用端的数字产业生态体系。”王刚说,公司准备新引进一批服务器保障算力供给,同时加强数字化产品研发力度,拓展算力应用场景,为客户提供更加符合需求的算力产品和服务。

  最新数据显示:在算力券政策的带动下,贵州已接到省外企业订单超18亿元。“今年计划发放的算力券包含总额1亿元的现金券和若干实物券。”算力券发放的执行主体、贵州省算力科技有限责任公司总经理杨云勇介绍,为帮助企业做好算力供需精准对接,公司赴北京、广东、福建等地推介,让有需求的主体深入了解贵州的算力资源,能够用得上、用得起、用得好。

  “算力券面向需求端发力,让使用算力和数据的企业直接受益,四两拨千斤,为整个产业链注入了活力。”贵州省大数据发展管理局局长景亚萍表示,聚焦算力高效利用,贵州正实施算力基础设施提升工程,推动全省数据中心从“以存为主”向“智算优先、算存一体”提档升级。在这一目标带动下,贵州将用好用足算力券政策,支持激励企业、高校、科研机构等购买算力服务,培育一批专业化算力运营商,力争今年带动算力产业规模突破100亿元。

  《 人民日报 》( 2024年04月21日 02 版)

(责编:白宇、卫嘉)