相关文章
视音频技术 - 我们在智能双语字幕的攻关历程
作者,中国移动咪咕,李琳,灯塔
作为顶尖的足球联赛,欧洲五大联赛在全球掀起了足球观赛热潮。为了让比赛“看得懂”咪咕贴心上线了智能字幕功能,詹俊、张路、黄健翔、徐阳、娄一晨、刘越、张力等组成的咪咕嘉宾天团的精彩解说不仅能被听到,更能通过智能字幕“被看到”,让更多…
建站知识
2025/3/19 19:56:01
文档级机器翻译综述:A Survey on Document-level Machine Translation: Methods and Evaluation
文档级机器翻译综述:A Survey on Document-level Machine Translation: Methods and Evaluation
author:Sameen Maruf, Fahimeh Saleh, Gholamreza Haffari , Monash University comment:Accepted for publication by ACM Computing Surveys…
建站知识
2025/3/19 19:58:37
多模态机器学习综述翻译(转载)
文章:《Multimodal Machine Learning: A Survey and Taxonomy》 多模态机器学习综述 【摘要】我们对世界的体验是多模式的 - 我们看到物体,听到声音,感觉到纹理,闻到气味和尝到味道。模态是指某种事物发生或经历的方式,…
建站知识
2024/9/16 21:33:51
不再内卷!视觉字幕化新任务合集
©PaperWeekly 原创 作者 | 上杉翔二 单位 | 悠闲会 研究方向 | 信息检索 目前跨模态图像或视频摘要/字幕生成(Image/Video Caption)任务已经得到了很长足的发展,并逐渐内卷化,比如今天出了一篇 Vision Transformer 变体,明天升级到需要百卡训练的大框架。因此,最近…
建站知识
2025/1/2 21:32:46
大华 解码器上大屏代码事例
昨天上传了一个海康解码器视频上大屏的代码事例 因为最近也在弄大华的设备 所以也传一份事例 希望对大家有帮助 有问题或建议可私信我
同样的 传调用代码 及结构定义
1.调用代码 /// <视频上墙>/// 视频上墙/// </视频上墙>/// <returns></re…
建站知识
2025/1/2 21:33:08
【MMML】多模态机器学习高被引综述论文笔记
论文名称:Multimodal Machine Learning: A Survey and Taxonomy 论文下载:https://arxiv.org/abs/1705.09406 论文年份:TPAMI 2018 论文被引:1266(2022/04/09) Abstract
Our experience of the world is m…
建站知识
2025/1/2 21:33:12
番外篇 齐老湿面试计
番外篇 老齐面试计 这次,老齐冒充软件行业的新人,带着隐形录音笔去公司面试,希望大家能够学习其中的套路,“旁白君”是我当时的内心独白,以后我会经常更新类似的内容,打开微信扫描二维码收听现场录音。 河北…
建站知识
2025/1/2 21:34:13