AI资讯
-
AI 视频生成工具 PixVerse 上线视频生视频功能,体验视频延长乐趣
爱诗科技推出的AI视频生成工具 PixVerse 上线 Video to Video(视频生视频)功能,可基于实拍视频或影视片段进行延长生成,进一步拓宽AI视频创作的可能性。登…… -
谷歌通用推理模型登场:思考速度比所有模型快5倍,能解摩斯代码,数学物理秒解决
谷歌发布“ Gemini 2.0 Flash Thinking ”AI推理模型,模型以极快的速度解决复杂问题并展示思考过程。在数学、代码、指令跟随等多个领域表现卓越,排名第一。模…… -
科大讯飞连续中标7大AI项目,两个月内狂揽11亿大单
科大讯飞旗下讯飞智元中标山东泰安市肥城人工智能行业大模型应用基地项目,投标金额约1.59亿元。项目内容包括智算中心基础设施建设,涉及基建、硬件平台和基础…… -
支付宝「探一下」新一代AI视觉搜索产品,满足你的好奇心
支付宝推出新功能“ 探一下 ”,基于自研的多模态大模型技术,能够“用AI之眼探索万物”,提供快速、有用、趣味的生成式搜索服务。“探一下”提供三种核心服务:探知…… -
谷歌 DeepMind 推 CAT4D:普通视频变 3D 大片,单视角视频也能转换多视角了
谷歌 DeepMind 联合哥伦比亚大学和加州大学圣地亚哥分校开发了 CAT4D AI 系统,能够将普通视频转化为动态 3D 场景。系统基于扩散模型,将单视角视频转换为多视…… -
HeyGen推全新数字人技术,与 Sora 实现集成
HeyGen 近日宣布推出全新数字人技术,并与Sora实现集成。此次合作产生的虚拟形象视频在许多情况下表现优于真人演员,且没有长度限制。HeyGen的虚拟形象完全由…… -
中文互联网语料 AI 资源平台发布:27 个数据集、总量 2.7T
中国网络空间安全协会发布中文互联网语料资源平台,含27个数据集、总量2.7T。该平台在中央网信办指导下,由协会与国家互联网应急中心等共建,经严格数据处理后…… -
Kimi 多模态图片理解模型 API 发布,1M tokens 定价 12 元起
2025年1月15日月之暗面发布全新多模态图片理解模型 moonshot-v1-vision-preview ,模型具备强大的图像识别和文字识别理解能力,能精准区分复杂图像细节,准确…… -
商汤「日日新融合大模型交互版」开放商用,限时免费
商汤科技推出“ 日日新融合大模型 交互版”(SenseNova-5o),正式对外开放实时音视频对话服务,限时免费使用。模型具备强大的实时交互、视觉识别、记忆思考和复…… -
谷歌 Gemini 2.0 Flash Thinking 强化版发布,登上 Chatbot Arena 榜首
谷歌发布 Gemini 2.0 Flash Thinking 推理模型的加强版,再次登顶Chatbot Arena排行榜。更新引入了1M长上下文处理能力,可对长篇文本进行更深入分析,减少模型……