视频调色是后期制作中的关键环节,它能将平淡的原始素材转化为富有情感的电影级视觉效果。然而,当前多数自动化调色方法如同“黑箱”操作,直接输出修改后的像素,缺乏可解释性,也难以满足专业人士迭代控制的需求。
为了解决这一痛点,我们推出了LumiVideo——一个智能体系统,它旨在模拟专业调色师的认知工作流程,包括感知(Perception)、推理(Reasoning)、执行(Execution)和反思(Reflection)四个阶段。LumiVideo只需接收原始日志视频,便能自主分析场景的物理光照和语义内容,进而生成电影级的基准调色。
其核心推理引擎通过结合大型语言模型(LLM)内置的电影知识与检索增强生成(RAG)框架,并采用思维树(Tree of Thoughts, ToT)搜索策略,有效探索复杂的非线性调色参数空间。值得注意的是,LumiVideo并非直接生成像素,而是将推导出的参数编译成行业标准的ASC-CDL配置和全局一致的3D LUT,从分析层面保证了时间上的一致性。此外,系统还提供可选的反思循环,允许创作者通过自然语言反馈来微调结果。
为评估自动化调色效果,我们同步推出了LumiGrade,这是首个针对日志编码视频的自动化调色基准测试。实验结果表明,LumiVideo在全自动模式下能达到接近人类专家的调色质量,同时在获得指令时也能实现精确的迭代控制,极大地提升了视频后期制作的效率和质量。