智能图像是计算机视觉技术的广泛应用推动的新兴爆炸性增长行业。随着人工智能技术的进步和广泛应用,这一新兴产业吸引了各方的关注。在计算机视觉技术中,图像识别,分析和应用正在日趋成熟。各方当前的重点是动态图像技术领域,包括视频识别和解构,自动化处理和智能制作,尤其是在媒体行业。随着人工智能应用的逐步发展,智能成像技术正在深刻地影响着这个传统而庞大的行业。
根据IABM(国际广播联盟)的数据,人工智能应用在媒体行业的渗透率将在2019年超过25%,其中Top5用于内容管理,智能成像。生产,内容分发,客户服务和明智的想法。
基于人工智能技术的智能图像技术已初步进入实用阶段。 2016年,二十世纪福克斯(Twentieth Century Fox)与IBM合作完成了第一部由人机协作完成的电影预告片《Morgan》。通过人工智能图像智能分析平台,对恐怖电影中的情感模式和类型进行场景识别和分析,形成对视听情感和场景的多模式语义理解,并通过对场景进行建模来表征恐怖电影预告片的关键内容,完成这一具有里程碑意义的内容创建和生产(请参见图1)。
图1:计算机与人之间的协作
过去,要制作一部十分钟的电影预告片,您需要录制,查看并选择并完成200个小时以上的视频内容需要大量的人力,时间和成本。智能图像的视频理解技术可以分析大量的视频内容素材,并通过模型识别关键内容,可以极大地增强创作过程。 IBM与20th Century Fox的合作证明,拖车生产(需要10到30天才能完成)可以在几小时内完成。不仅如此,Thanos(参见图2)在2019年发布的《复仇者联盟4》(Avengers: Endgame)中的角色,以及哈里森·福特在2018年发布的013010(Solo:A Star Wars Story)中的角色。Han独奏,电影中的图像和一系列表演都是由人工智能工具和模型完成的,这些工具和模型可以使部分制作过程实现自动化,而过去,这种情况使专业CG(计算机动画)团队变得十分复杂。 VFX(计算机视觉效果)可以通过机器学习快速完成。
图2:AI中Thanos在《星球大战》中的作用
将物理模拟与AI/ML和具有领先思维的艺术家相结合,将图像与图像相结合Ziva Dynamics首席运营官Michael Smit表示,创作者将导致视觉特效世界的颠覆性变革,从长远来看,这将从根本上改变内容的创作方式。
视频内容将成为文字和图片之后的主要信息载体。随着信息视频的发展,视频内容的生产和广播将进一步发展为个性化和智能化,智能图像和机器图像并存。国内智能视觉技术公司Spectrum Technology表示,智能影像技术在流媒体领域的全面应用将促进个性化和交互式智能内容的发展,将成为重要的组成部分,并已达到大规模应用的临界点。
自主开发的流媒体自动制作系统基于视觉智能技术,可以在短时间内生成大规模,易于理解甚至创新的流媒体内容。
对于流媒体内容行业,许多最耗费人力和重复性的任务通常需要外包给专业团队,但是随着智能成像技术的最新发展,这些任务不仅可以完全自动化从而降低了成本并大大减少了生产时间。例如,Aspera使用智能成像技术来自动交付视频内容捕获和制作。 更重要的是,通过智能图像技术,创意人可以摆脱繁琐而重复的工作,将时间和精力放在创意内容上,创意图像还可以使创意人在短时间内看到更多创意选项。
国内媒体产业,尤其是CG和VFX,在创造力和制作方面起步较晚,但是随着媒体战略的深化和智能影像技术的大规模成熟应用,文化媒体行业欢迎变革的机会。
当前,智能媒体的重点主要集中在三个领域:
(1)流媒体内容分析和场景商业化:通过对视频内容的多模式理解,识别视频内容中的场景,角色,对象,运动和情节根据场景和内容的受众,通过诸如视频浮动层之类的技术嵌入到商业材料或载体中。
(2)媒体内容的自动制作:例如,为目标受众定制电影预告片和电视节目的语义/情感内容,视频内容的自动编辑,编辑和制作,家用智能图像制作平台AI和人机之间完全协作的数百个视频内容可以在几个小时内完成。
(3)内容创建和制作:该领域在中国相对较晚,但是发展非常迅速。它结合了物理和虚拟性,在视觉效果中实现了身临其境的效果,使影视内容本身的创造力无限。延伸。
根据IABM在2018年的一项研究,智能成像技术发展面临的挑战主要来自缺乏专业技术能力和专用的智能成像技术平台。相对而言,中国智能影像技术的发展需要一个平台化和产业化发展的平台,即集成了云计算,大数据和AI功能的专用AI平台。频谱技术是典型的智能成像技术系统的开发者和倡导者。 例如,其智能影像系列方案集成视频内容生产引擎、机器学习、自动化标注、关键帧抽取、大数据等关键应用技术,确保国内传媒机构可以无缝管理内容生产及内容商业化,并确保商业化内容库存水平和摊销处于平衡状态。