1分钟看懂AIGC，2月26日行业热点汇总_科技

1、AIGC相关仓位新年大增，同比增长6倍

猎聘大数据研究院最新推出的《2024年新年工作第一周就业洞察报告》显示，Sora的出现带动了AIGC领域新年创业人才需求激增。猎聘大数据显示，其新增职位较去年第一周上班有所增加。平均年工资44.37万元。从AIGC相关职位TOP5职能分布来看，算法工程师和产品经理位列前两位，占比18.95%和12.63%；视觉设计、自然语言处理、图像算法排名第三至第五。

2、AI Pin发货时间再次推迟

根据企业媒体负责人 Sam 发布的新视频，爱拼发货将推迟至“4 月中旬”。他介绍说，第一批产品计划于3月底开始出厂。如果遵循此时间表，“优先访问”客户将在四月中旬开始收到产品。剩余的预订单将在不久后交付。据悉，Ai Pin 目前已开放预购，售价 699 美元。 3 月 31 日之前预订的用户可免费获得该设备三个月，每月订阅费用为 24 美元。

3、被曝AI模型“无法画白人”，谷歌高级副总裁也致歉

据美联社等媒体报道，谷歌推出的AI模型具有根据文本生成图像的功能，但最近有用户发现，生成的图像中的大部分人都不是白人，而是人。的颜色。一些用户认为该模型在生成图像的过程中存在“反白”问题。对此，谷歌表示暂时中止生成人体图像的功能。美联社报道称，拉加万 23 日在谷歌博客上发帖称，“很明显，这一功能未能达到预期效果”。他还表示，“生成的一些图像不准确，甚至具有冒犯性。我们感谢用户的反馈，并对该功能运行不佳感到抱歉。”

4、AI-RAN联盟正在成立，三星、ARM、微软等11家公司加入。

AI-RAN 联盟今天在巴塞罗那成立。该组织旨在通过与相关企业合作，将人工智能与无线通信技术结合起来，引领技术创新。据悉，该组织有11家初始成员，包括三星、ARM、爱立信、微软、诺基亚、英伟达、软银等半导体、电信、软件巨头。这个新联盟将合作开发创新新技术，并将这些技术应用到商业产品中，为即将到来的6G时代做好准备。

5、百度副总裁：用AI赚钱是今年的重点

据消息称，百度MEG（移动生态事业群）近期迎来新一轮组织架构调整。百度文库事业部升格为业务部，继续由副总裁王瑛领导。副总裁赵士奇重返百度担任搜索平台负责人，搜索业务负责人将向他汇报。百家号业务运营部等关键部门纳入信息分发平台，向百度App总经理李小万汇报。内容生态平台原总经理宋健已辞职。据介绍，作为百度核心收入来源的MEG部门致力于实施AI转型战略。百度高级副总裁、MEG部门负责人何俊杰在2024年一季度OKR中明确提出：“引领AI产业发展，重构代表性场景，实现效益。”

6、传音发布1款机器狗：能爬楼梯，可用于娱乐、教育等场景

传音旗下品牌Tecno在2024年世界移动通信大会（MWC 2024）上发布了一款人工智能增强型四足机器人——机器狗Tecno 1。传音表示，机器狗的首次亮相是为了展示公司在先进机器人和人工智能领域的创新能力。传音表示，这款机器狗可用于娱乐、辅助、教育和训练场景，将是“未来完美的宠物伴侣”。

7、“人车交互”新突破！普渡大学发布框架：可学习/可定制的“指令识别”系统

框架的运行过程涵盖了从接收命令、处理推理到生成可执行代码。结合云端的实时环境数据，包括天气、交通状况等上下文信息，该框架可以理解驾驶员不同程度的模糊指令，有效降低人工接管率。

论文链接：

项目网址：..io/

8、三星将首次公开展示智能戒指Ring

2月25日，三星电子发布新闻稿称，在西班牙巴塞罗那举行的2024年世界移动通信大会（MWC）上，三星电子将通过AI带来全新的移动体验。参观三星展位的参观者将可以在所有产品上亲身体验人工智能，包括S24系列。人工智能还将扩展到整个三星产品组合，包括 Book 4 系列、 4 以及首次推出的 Ring。

9.Sora训练数据疑似曝光，网友：肯定用的是UE5

Sora产品近期发布了多个视频，所展示的效果赢得了网友的敬畏。视频内容丰富，从水肺潜水到探索沉船，再到描绘日本江户时代宁静场景的立体模型。此外，Sora还暴露了一些新功能，例如无缝连接，可以在两个输入视频之间逐渐进行插值。不过，也有网友讨论了Sora生成的视频背后的训练数据来源。主流观点认为Sora可能使用了3D引擎或者虚幻引擎进行训练。

10. 成立通用具身智能研究团队

高级研究科学家Jim Fan在社交平台上发文透露，他将与老搭档朱宇科一起在内部组建一个新的通用具身智能研究团队GEAR。他们正在开发可以学习在虚拟世界和现实世界中行动的 GEAR。人工智能代理。其领先研究包括“GPT-4编写激励函数，教五指机械臂如何比我做得更好。经过GPU加速物理模拟训练，速度比实时快1000倍”等。

11. 访问 Notes应用程序

谷歌上周向个人帐户推出了第一组功能的预览，并开始为其笔记应用程序 Keep 测试由大型语言模型驱动的人工智能功能。此功能可帮助用户快速完成购物清单、待办事项清单和装箱清单。当用户创建新的记事本时，页面上将出现“帮助我列出列表”浮动操作按钮。用户点击后，可以创建提示词，例如“夏天带两个孩子露营的装箱单”。 ”、“万圣节值得一看的经典电影”等。

12.谷歌发布通用视觉编码器

谷歌最近提出了一种通用视频编码器，可以通过单个冻结模型处理不同的视频理解任务。在包含 3600 万个高质量视频字幕对和 5.82 亿个带有噪声并行文本的视频剪辑的数据集上进行了预训练。研究团队对四大类视频理解任务进行了广泛的测试，并在 33 个视频理解基准测试中的 30 个中取得了性能领先。论文于2月20日发表在arXiv预印本平台上。

13. 贝佐斯和英伟达紧随其后投资人形机器人公司AI

据知情人士透露，贝索斯、英伟达等大型科技公司正在投资一家人形机器人初创公司 AI，该公司在一轮融资中筹集了约 6.75 亿美元，高于其最初寻求的 5 亿美元。价值约20亿美元。

贝佐斯投资了1亿美元，微软投资了9500万美元，英伟达和亚马逊各投资了5000万美元，一度考虑投资500万美元收购AI。英特尔投资2500万美元，LG投资850万美元，三星投资500万美元。

14.首部中国原创文森视频AI卡通系列今日播出

首部中国原创文声视频AI动画片《千秋诗颂》即日起在CCTV-1综合频道播出。《千年诗颂》是中央广播电视台联合上海人工智能实验室等合作伙伴，基于央视听媒体模式打造的。它是第一部使用人工智能制作的生成电影在主流电视台播出的电影。创作者利用简单的“风格参考”“图片+提示词”就可以完成《千秋诗颂》中人物、场景、动画等诸多元素的生成。动画片讲述了李白、杜甫、孟浩然等诗人的诗歌和生活故事，共26集，每集约7分钟。影片从美术设计到动效生成再到后期制作，全部由生成式AI辅助制作。

我的世界效果指令代码大全_mc效果指令大全_如何获得效果指令大全

15、荣耀发布AI全场景战略

据界面新闻报道，2月25日，荣耀在2024 MWC世界移动通信大会上发布AI赋能全场景战略，推出平台级AI赋能、以人为中心的跨操作系统体验以及基于人性化的新体验。关于意图识别。电脑交互，以及与全球合作伙伴合作的荣耀Pro、AI PC等一系列智能设备。

荣耀还发布了Magic V2 RSR保时捷设计版，海外售价2699欧元（16GB+1TB），约合人民币21000元。

16、MWC 2024：高通推出全新AI Hub，帮助AI推理速度提升高达4倍

高通在今天的MWC发布会上正式推出了全新的 AI Hub，为开发者创建一个获取开发资源的中心，以便他们能够创建基于或高通平台的AI应用。 AI Hub将支持超过75种AI模型，包括传统AI模型和生成式AI模型。通过优化这些模型，开发人员可以将 AI 推理的运行速度提高 4 倍。

17、中控科技将推出首个大型生成式工业AI模型

中控科技将推出首个面向流程工业运行优化设计的大规模人工智能模型，利用海量生产运行、工艺、设备和质量数据，自主开发生成式人工智能算法架构（AIGC），并基于工业多源进行集成数据。培训，建立流程工业高泛化、高可靠性的大模型，为客户提供AI+安全、AI+质量、AI+效率、AI+低碳的智能解决方案，可能带来流程工业效率的革命性突破。流程工业。

18、索拉的惊艳画面太震撼了，好莱坞导演赶紧关闭8亿美元的工作室！

空“内测”提前开启，影视失业即将来临

刚刚，Sora的第二波视频发布了！模拟现实的一致性和保真度令人瞠目结舌。在好莱坞，一些导演取消了耗资 8 亿美元的工作室扩张计划。

虽然Sora还没有正式开放该功能，但在技术报告中，你已经可以体验了！

举报地址：

通过选择不同的关键词，如人物、服装、天气环境、地理位置等选项，您可以体验Sora生成的不同视频。

19、GPT-4同时被曝重大缺陷，逻辑推理被颠覆！

谷歌最新研究发现，问题中前提条件呈现的顺序对大型模型的推理性能具有决定性影响。打乱顺序会使模型性能降低 30%。

最近，谷歌和斯坦福大学的研究人员发现，当大型模型处理逻辑推理任务时，问题中信息呈现的顺序对模型的性能具有决定性影响。

论文地址：

具体来说，当信息按照逻辑上的自然顺序排列时，模型的性能会更好。这一发现不仅适用于一般逻辑推理问题，也适用于数学问题。

20、有了NPU的支持，微软画图应用有望迎来新的AI功能

现在运行在11系统上的Paint将迎来新的AI功能，该功能可能会依赖NPU来运行。在微软最新版本的画图应用程序中，发现了一个名为“”的文件，这表明版本11的画图应用程序很快就能检测到并可能利用设备上的NPU。 Paint 可能会集成需要 NPU 功能的 AI 功能，例如高级图像编辑工具或直接在设备上使用 AI 算法的实时效果。当然，也不排除微软正在开发其他功能的可能性。

21、推出“meta-”，显着提高GPT-4等模型内容的准确性

之后，斯坦福大学的研究人员推出了一种创新的大模型增强框架——meta-（简称“meta”）。

meta可以增强GPT-4、PaLM和LLaMa等模型的性能，使生成的内容更加准确、安全、可靠。

技术原理也简单明了，并通过将模型复杂的任务或问题分解为更小的、可管理的子任务并将其分配给更强大的专家模型来指导。

实验数据表明，meta与GPT-4结合后，在不同任务中的测试表现都非常强。例如，在 Game of 24、-in-One 和测试任务中，meta 的准确率明显优于其他主流方法。辅助提示框架。尤其是当meta与代码解释器结合使用时，效果就更好了。

论文地址：

22. Reor：一个在本地运行模型的开源人工智能笔记应用程序

Reor 是一款基于人工智能的笔记应用程序，可在本地运行模型以保护用户数据隐私。该应用程序使用自然语言处理技术，允许用户在笔记中添加文本、图像和录音。它还可以自动识别笔记中的关键信息并将其转换为可编辑的文本。与其他云笔记应用不同，Reor运行在用户设备上，不需要将数据上传到云端，不仅节省了用户的存储空间，也保证了用户数据的安全。此外，该应用还支持多设备同步，允许用户在不同设备上同步记事。

23. LWM-视频语言模型可以回答长达数小时的视频问题

最近，开发了一种新的视频语言模型，可以回答数百万字的视频问题。该模型采用循环注意力机制和微调的7B参数模型，在检索基准测试中表现极其准确，优于商业视频语言模型。

AIGC行业应用交流群，请直接搜索【王继伟频道】