图片名称

【庆余年】AIGC行业周报

2024-09-19 23:54:23

作者:AG真人国际·(中国)官方网站-登录入口


每经编辑 张锦河    

开栏语:《AIGC行业周报》梳理AIGC行业一周内发生的行业重要动态,产品发布和业内大咖的周报最新观点。

图片来源:每经制图

一、行业市场企业动态

(一)微软和苹果告别OpenAI董事会观察员席位

微软和苹果纷纷放弃OpenAI董事会观察员席位,周报微软称其有限角色不再必要,行业OpenAI表示期待继续合作,周报庆余年且此后不再为合作伙伴留董事会观察员席位。行业

两大公司的周报退出可能是因反垄断压力,监管机构担心其垄断地位阻碍AI技术创新和应用,行业已对相关合作展开调查。周报

OpenAI发展路径引发质疑,行业其转型为混合架构被视为背叛初衷,周报且可能进一步转变为营利企业并筹备IPO。行业钉钉

(二)OpenAI CEO又创办了一家AI健康公司!周报

阿尔特曼与赫芬顿宣布成立Thrive AI Health公司,行业目标是打造个性化AI健康教练。

该公司希望通过AI改善人们的生活习惯,预防慢性病,CEO为谷歌前健康和可穿戴设备负责人洛夫。

已与一些前沿学术机构和医疗中心建立研究合作。

二、产品技术动态

(一)可灵网页版上线

快手可灵网页版上线,基础模型升级,新增首尾帧控制和镜头控制等功能,文生视频开放到10秒,腾讯视频同时可图开源。

快手拥有包括可灵、可图、快意等在内的大模型矩阵,并搭建了数字人全流程AIGC服务,还在APP评论区上线了智能体“AI小快”。

快手坚持自研,拥抱开源开放,将大模型技术与实际应用场景深度融合,重点聚焦几大场景,还与高校等合作推动生态发展。

(二)商汤发布日日新5.5及相关产品,多项测评超GPT-4o

商汤发布日日新5.5,包括流式多模态交互的5o版本,多项测评超GPT - 4o,还推出了端侧大模型和相关产品。

商汤现场演示了日日新5o的实时音视频交互能力,还推出了可控人物视频生成AIGC产品Vimi。

商汤推出0元Go计划,推动开发者和行业客户加入,端侧大模型价格低至每台每年9.9元,还推出了多种行业大模型和解决方案。

(三)达摩院发布AI视频创作平台“寻光”

达摩院发布一站式AI视频创作平台“寻光”,以解决AI视频创作中可控性差、工作流繁琐等问题。

寻光平台具有基于图层的视频编辑功能,可提升创作效率,且交互简洁,编辑能力丰富。

“寻光”将于近期开放内测,旨在成为创作者的专属视频工作室,释放AI的生产力。

(四)Stable Diffusion 3允许商业化并将开源更大版本模型

Stability AI修改社区许可协议,允许年收入低于100万美元的企业和个人开发者免费将Stable Diffusion 3 Medium用于商业化,此前该模型仅能用于学术研究。

Stability AI表示未来几周内会发布更大版本的模型并继续开源,此前SD3 - M在图片质量、文本语义还原等方面有很大提升,训练数据集也进行了优化。

Stability AI能及时修改协议受到大家欢迎,其修改协议的举措将惠及广大开发者和小型企业。

(五)Odyssey展示全新视频模型,获900万美元融资

Odyssey展示的视频模型内置4个模型,可生成高质量视频元素并合成视频,效果可媲美好莱坞级特效。

该模型支持拼接和文本提示两种生成方法,生成的视频可导出为3D标准化格式文件进行二次编辑。

Odyssey核心开发团队强大,将与好莱坞影视制作公司合作,目前已展示demo视频,很快会开放使用。

三、前沿观点

(一)人工智能现状报告:应用、挑战与展望

报告显示人们对AI情绪从谨慎到略高估,AI应用进展缓慢但稳步上升,小公司和大公司使用率高,部分人隐秘使用AI。

AI工具中,OpenAI模型常用,向量数据库使用增加,多数公司租用云提供商的GPU资源,HuggingFace是最常用的AI开发工具。

开发AI应用的主要障碍包括数据安全等,人们对AI技术栈满意度较高,多数认为未来十年内实现通用人工智能的可能性高。

(二)红杉美国合伙人Pat Grady谈AI的发展与影响

Pat Grady认为AI技术处于关键转折点,稳定的基础模型有助于AI生态发展,AI将为服务行业带来变革性机遇,且不会取代现有软件公司。

他认为目前的模型能力足以构建数万亿美元的新业务,模型的稳定性对生态系统有益,AI的发展将从训练阶段转向推理阶段。

Pat Grady还提到AI在风险投资中的应用,以及AI对服务行业的赋能,同时认为当前AI领域的资金存在泡沫,但人们对其应用的现实有清醒认识。

(三)智谱AI CEO张鹏谈大模型发展

智谱AI CEO张鹏认为大模型落地需要周期,应关注技术与应用结合的过程,超级应用的出现受多种因素影响,需保持耐心并多尝试。

开源和闭源模型目标和意义不同,智谱的商业化重心在ToB,为客户提供多种解决方案,且已有用户从OpenAI迁移过来,公司已布局国际业务。

大模型的Scaling Law内涵在变化,智谱认为其发展应迈向通用人工智能,下一步需具备多模态能力,实现“脱虚向实”,同时要注重安全。

来源:每经科技提供