视频压缩技术的创新前行者:用二十年锻造精彩——对话2019年欧洲发明家大奖“终身成就奖”最终入围者玛尔塔·卡兹维茨博士

2019-05-20 20:05

1

作为视频压缩技术的开创者,和拥有全球近400项专利的发明家,玛尔塔·卡兹维茨(Marta Karczewicz)博士因二十多年在视频编码领域一系列卓越的研究成果,于5月7日成为欧洲专利局设立的欧洲发明家大奖中“终身成就奖”提名的三位最终入围者之一。

欧洲发明家大奖是为表彰那些通过发明对技术进步做出实质性贡献并且改善人们日常生活的欧洲杰出发明家而设立的。其中,享有盛誉的“终身成就奖”旨在表彰那些拥有长期贡献和重要专利发明,并已对技术领域和整个社会产生巨大影响的个人发明家。

玛尔塔·卡兹维茨的工作侧重于视频编解码,这是实现对大量原始视频数据进行压缩并通过蜂窝网络传输的基础性技术。她所开发的编解码器已在近年变革了视频流传输和视频娱乐行业,在多种视频压缩标准中发挥重要作用,比如高级视频编码(AVC)和高效视频编码(HEVC)。

过去20年,玛尔塔·卡兹维茨的数百项发明帮助人们在移动终端上实现高质量视频直播、举行视频会议和使用虚拟与增强现实。支持在可察觉图像质量无损的情况下将视频文件压缩1000倍,使得当今全球各地的观众能够通过互联网进行视频流传输。

如今,每当一个视频通过在线服务或地面广播网络的高清电视信号进行视频流传输时,几乎都在编解码时采用了她参与制定的高级视频编码(AVC)视频标准。人们能在平板电脑和智能手机上观看电影,很大程度上得益于玛尔塔·卡兹维茨和她所带领的团队的研究成果。

玛尔塔·卡兹维茨是难得一见的健谈的科学家,也有女性特有的体贴周全,她依据提问者的知识结构和知识储备情况调整自己的讲述方式。对专业领域的研究和发展脉络知无不言,娓娓道来,同时柔和谦卑,绝不卖弄和夸夸其谈。

作为高通公司技术副总裁,玛尔塔·卡兹维茨通常将自己一半的工作时间用于探索下一代压缩技术以及开发未来标准,另一半工作时间则用于实施和应用已经完成开发的视频编码解码技术。比如,她和她的团队正在尝试通过视频技术使远程医疗成为可能——在高效和精准的视频技术帮助下,使一些就医难的患者有效地获得医生的帮助。

她认为视频技术的终极目标是实现一些科幻电影中所描述的应用场景,比如早晨醒来打开电视,人们可以借助摄像头等设备的辅助实现沉浸式体验,屏幕画面可以从细节、色彩与对比度上完美复现周边的环境。但这样的体验并不会马上到来。

“首先,我认为视频编码和视频压缩技术在逐渐走向成熟,但距离技术极限还有很长一段距离,而且这中间还可以进行不断的技术突破。”她说,“因为视频编码现在已经变成了一项非常复杂的技术,我们可以在单个模组或者单个方式上取得进展,但是如果要想对技术进行全面提升的话,需要团队互相合作、互相学习,并互相给予灵感。同样,我们也需要协同整个产业界的努力。”

玛尔塔·卡兹维茨以她个人的工作经历分享道,“通常在视频编码方面,你的十个想法里可能只有一个想法能够被往前推进,可能做了非常多的工作才能取得0.5%或者1%的改进。事实上,视频压缩或视频编码技术从开始启动研发工作到能够有成果向外界展示至少需要三、四年的时间。通常,当一项视频编码技术被纳入标准后,针对其进行改进或者去设计出一种新的方法时,若想在现有的基础上获得30%的提升,是一项难度非常大的工作。

2

换句话说,在今天的视频压缩和视频编码领域,即使是改进一种单一的方法,要想取得进展都有很大的难度。正如我所言,整个领域的技术正在逐渐地走向成熟。因此,要想提升即使只是1%,也可能需要尝试和实践多达数十种不同的想法,并进行多次的模拟和验证,才能够找到一个潜在的、能够改进的方法,然后再进一步去推进。”

仅仅是玛尔塔·卡兹维茨目前管理的团队,就需要7000台计算机组成的计算机集群。研发出一个新的视频编码技术并向外演示,至少已经尝试了30到40个不同的方案。一旦一个新的方案诞生,接下来的标准化过程一般至少需要3年的时间。

据此可以想见,视频编码领域的新技术从一个想法到最终被市场认可,满足消费者的需要是一项耗时且耗资巨大的投入——以AVC为例,从开始启动到其成为一个相对主流的标准,经历了大约10年时间。

或许,科学研究算得上是地球上漫长艰辛的工作。但与玛尔塔·卡兹维茨交谈,你几乎感觉不到她作为一个科学家的“艰辛”。业余时间,玛尔塔·卡兹维茨最喜欢看电影,也和很多女性一样热衷购物和社交。而工作中,她甚至会让自己刻意抽身出来,“我的很多想法都是在海滩上散步的时候想出来的。给自己一些间歇性的窗口,会让工作更高效。”她说。

这或许得益于玛尔塔·卡兹维茨有一对包容的父母,他们更看重她是否快乐,而从不督促她努力学习或辛勤工作。在她读博期间抱怨周末要写论文而不能出去玩时,他们甚至建议她放弃博士学位去享受生活。

或许科学家的成功秘诀就在于——普通人费尽心力都未必能做到的事,于他们而言,是与生俱来的天赋。

3

1970年,玛尔塔·卡兹维茨出生在波兰什切青市。她在少女时代就表现出巨大的数学才能。在高中时期,她自己报名,作为所在学校唯一的参赛选手参加数学奥林匹克竞赛,并击败了数十位参加过系统培训的“专业”选手进入前十名。这让她能够免试进入波兰所有大学的部分指定硕士学位项目。

这个天赋异秉的故事更像一个隐喻,注定了这个怀揣数学绝技的女孩,在此后二十多年的发明旅程中,不断向自己发出挑战,再欣然应战,永不厌倦。

大学期间,她开始对视频压缩产生兴趣。玛尔塔·卡兹维茨说:“我喜欢需要分析大量数据并寻找规律的问题,视频压缩正是这类问题。”当时,视频压缩是一个相对新兴的领域,MPEG-2标准刚刚制定完成,前景非常广阔。而玛尔塔·卡兹维茨也热爱特效电影,是《星球大战》和《侏罗纪公园》的忠实影迷。

后来她获得诺基亚奖学金,前往芬兰坦佩雷大学学习信号与图形处理。攻读硕士学位期间,玛尔塔·卡兹维茨在坦佩雷大学信号处理实验室担任助理研究员。视频压缩技术研究便是她参与的众多诺基亚研究项目之一。

1996年,玛尔塔·卡兹维茨加入诺基亚,在芬兰担任诺基亚公司的高级研究工程师。期间,她获得了博士学位,并在1999年前往美国达拉斯出任诺基亚研究中心研究经理一职。2006年,玛尔塔·卡兹维茨加入高通公司。

二十年来,玛尔塔·卡兹维茨的发明已在多种视频压缩标准中发挥了重要作用,比如高级视频编码(AVC)、高效视频编码(HEVC)、以及即将推出的多功能视频编码(VVC)。回看我们在视频压缩技术上取得的成果,如果把VVC与此前的MPEG-2和H.263视频编码进行对比,我们可以发现在保持图像质量不受影响的前提下,全新视频压缩标准的压缩比已经增加了80%以上。

4

如高通工程执行副总裁兼首席技术官JimThompson所言,玛尔塔·卡兹维茨获得欧洲专利局设立的欧洲发明家大奖这一享有盛誉的奖项提名,“再次证明了高通公司发明的基础科技的价值,以及高通拥有世界一流水平的发明家。”

在圣迭戈,玛尔塔·卡兹维茨所工作的高通公司,是一家由发明家和工程师组成的公司。研发人员在员工中超过80%。过去30多年,高通的技术发明驱动了整个无线通信产业的创新。而在玛尔塔·卡兹维茨看来,为发明申请专利是非常有必要的。“因为通过这样的方式,可以快速公开我们的发明,同时还能够把我们的发明与其他公司或领域的技术进行更好地结合,让不同的发明者之间互相启发。”

事实上,通过专利许可模式以更大范围的合作激发连贯性技术探索,同时以标准化的方式推动技术演进的模式已充分体现出其价值。2016年,AVC成为全球最常用的视频标准,约占互联网上全部流传输视频的79%。

玛尔塔·卡兹维茨推动的视频压缩技术的研究,帮助高通在其主要行业中保持技术领先优势。2017年,HEVC主导了面向智能电视的4K视频市场。编解码器市场规模达到15亿欧元(17亿美元),预计到2023年,市场规模将以4.26%的年均复合增长率(CAGR)增长至25亿欧元(29亿美元)。

目前,玛尔塔·卡兹维茨和她的团队正在研究多功能视频编码 (VVC),这是2020年即将推出的全新视频压缩标准。而2019年欧洲发明家大奖“终身成就奖”颁奖典礼将于欧洲中部时间2019年6月20日在奥地利维也纳举行。

5

玛尔塔·卡兹维茨(Marta Karczewicz)

高通公司技术副总裁

沈建缘:因为什么,使你如此热衷于视频压缩相关技术的研究?

玛尔塔·卡兹维茨:当时我在选择研究课题时就决定了主攻视频编解码器这一方向,其中部分原因确实是因为我喜欢看电影,喜欢看分辨率高的电影。我尤其喜欢看一些特效电影,比如《星球大战》和《侏罗纪公园》,我非常喜欢其中的视觉特效,并且希望自己能够完全沉浸到电影的环境当中。而要实现这种沉浸式的体验,就需要高质量的视频,因此爱看电影确实是促使我当时决定研究这个方向的因素之一。

沈建缘:AVC(高级视频编码,Advanced Video Coding)关键组件中,由你发明的去块效应滤波器这一关键技术,最难解决的问题是什么?

玛尔塔·卡兹维茨:去块效应滤波器以及它作为整个AVC当中的一个关键组件相关的研究,是我最初研究的很多课题之一。当时我所研究的上一代视频编解码器技术,如H.262、H.263当中包括的去块效应滤波器,在分辨视频实际内容的能力上还有待提高,有时它们不能有效地分辨虚假边界和真实边界,而分清视频信息之间的真实和虚假边界,是去块效应滤波工作需要解决的重要问题。此外,需要判断在虚假边界的周围是否存在有用的信息或者重要的图像,这样能够帮助我们决定运用功能更强或是更弱的滤波器。

我和我的团队主要做出了两方面贡献。首先,基于我们的量化技术,同时根据图像的内容,并且参考一些额外的编码参数来确定滤波器强度的大小。也就是说,对于虚假边界进行去块滤波时,正是因为我们添加了不同的编码参数,新的去块效应滤波器能够决定适当的滤波器的强度,从而决定对于虚假边界的去块效应滤波器功能的强弱。第二,我们在去块效应滤波器当中加入了更加强大的图像内容的分析能力,这样能进一步帮助我们判断何时运用何种强度的滤波器,以及判断在何种情况下运用更强的滤波器可能会去除掉有效内容。

6

总而言之,我们在“去块效应滤波器”的技术当中的主要贡献是能够判断和设定适当的滤波器强度,这主要涉及两个影响因素:第一,是要推算和测量所涉及的人工边界的大小,例如根据长方形图像的传输、长方形运动的预测等方面来预估;第二,是图像内容,例如,如果在人工边界的两侧具有较多的图像信息,此时就需要慎用强效果的滤波器。

沈建缘:相比获得(欧洲专利局)终身成就奖提名,在近20年的研究工作中,你获得的最大成就感是什么?

玛尔塔·卡兹维茨:迄今为止,在我的职业生涯当中,最让我感到满意的是整个视频压缩技术领域取得的总体进步。我认为我最大的成就并非来自于个人,最让我感到高兴的是我和同事们作为一个团队所取得的成就。其中让我感到格外兴奋的一项成就是我们团队在HEVC标准确定之后,继续通过创新和改进工作所推动的VVC标准。

在我刚刚投身这一行业之初,人们只能通过电视来观看视频,当时的移动终端还不具备视频功能,视频在当时甚至都算不上是一个小众的应用。但后来,由于近年来视频压缩技术的发展,也基于我们团队的贡献,视频已经成为了被人们最广泛使用的应用之一,不再局限于从电视或广播中进行下载或流传输。人们还可以进行视频聊天,以更加轻松和充满乐趣的方式与家人和朋友实现连接。例如,我在美国工作,但我的父母在波兰生活,我和我的父母几乎每天都要进行视频通话,在通话中看见彼此要比仅听到对方的声音有意思得多。视频技术大大地改善了娱乐体验,使得人与人之间的连接变得更加便捷。

沈建缘:你的父母如何看待你的工作?

玛尔塔·卡兹维茨:我的父母一直非常支持我,他们并没有要求我在学习或工作中向特定方向发展。比如我上学的时候很喜欢数学,不喜欢那些需要死记硬背的学科,而数学不需要背任何东西,只需要分析和解决问题的能力。

当然,我的父母希望我能接受良好的教育,但除此之外他们更看重我是否快乐、健康,能不能享受自己的生活。他们并没有督促我努力学习或者勤奋工作,比如我在芬兰硕士毕业后去诺基亚工作的同时我还在攻读博士学位,当时我对于读博士有所抱怨,认为写论文和各种各样的研究项目占据了我周末休闲的时间。我父母知道这件事后问我要不要考虑停止博士学业,他们认为我已经21岁了,要开始学会享受生活。

沈建缘:漫长而艰难的研究过程,是否会偶尔感到焦虑?

玛尔塔·卡兹维茨:我们在研究工作中确实会遇到连续数月没有任何成果产出的情况,但我个人并不会为此感到沮丧或担心,因为工作的过程和工作的结果都让我觉得充满乐趣,我们在研究过程中也是不断地分析问题、解决问题。即使我们的想法没能试验成功,我个人也不会因此感到失望,而是会继续推进工作。

关于工作中的焦虑问题,在高通的工作环境中,我的领导或管理层都非常理解研究工作的特点——研究人员不可能每天都产生伟大的想法。这样的工作氛围不会造成紧张、焦虑等心理压力,我们可以勇敢尝试,也会包容失败,而且我们也会相互鼓励,很可能现在的工作再坚持一段时间就会取得研发成果。

我认为研发进展的停滞或者工作中的挑战之所以不会让我灰心失望,正是由于我们是作为团队在通力合作。从团队的角度,即使我作为团队领导者没能提出一个好的想法或解决方案,团队中的其他成员也能提出其他好想法和好方案,团队的成员之间可以起到一个互相补充、互相帮助的作用。

沈建缘:您认为女性想要获得成功还需要哪些因素?

玛尔塔·卡兹维茨:对于一位女性工程师或科研人员而言,我的建议是,不要因为职业道路中的困难和挫折而灰心,且合适的工作环境和工作场所非常重要。比如在高通的工作环境中,男工程师或女工程师都会受到同等的对待,这里的工作氛围始终非常支持我的工作和职业发展。所以如果一位女性决定要成为工程师或者从事视频技术领域的研究,我觉得她应该大胆地、自信地走出这一步。尽管现今的标准化组织中男性的比例可能略多于女性,但是很多参加标准化组织的公司团队领导人都是女性。除了高通以外,英特尔、腾讯等多家公司的标准化工作组领导也都是女性。

沈建缘:作为一位女发明家,你通常如何度过工作之外的时间?

玛尔塔·卡兹维茨:和所有女性一样,业余时间我喜欢购物,喜欢和朋友一起聊天八卦,也喜欢做一些家务,但我更喜欢看电影。我认为偶尔抽身于工作之外,适当放松会让工作更加高效,而一天12个小时都坐在电脑前反而不会让我产生任何有趣的想法,比如我很多优秀的想法都是在海滩散步时得到的灵感。从在芬兰工作时我就养成一个习惯,有时我会强迫自己暂停工作,给自己一些间歇的窗口,这样的时刻能让我产生一些非常好的创意。

7

沈建缘:对有志于发明研究的年轻人有什么建议?

玛尔塔·卡兹维茨:找到适合自己的公司和团队十分重要,这样的氛围可以使你愉快地工作,你的职业发展也能得到支持。总而言之,要相信自己,相信你的同事和团队,也要相信欢迎你并能支持你提升职业发展的公司。

【科学家简历】

玛尔塔·卡兹维茨博士(Marta Karczewicz)

出生日期:1970年4月1日

出生地:波兰,什切青市

国籍:波兰、美国

居住国:美国

目前职位:高通公司技术副总裁

教育:芬兰坦佩雷大学信息技术硕士、博士

职业生涯:

1993—1996年,坦佩雷大学信号处理实验室担任助理研究员

1996年,芬兰诺基亚公司任高级研究工程师

1999年,美国达拉斯任诺基亚研究中心研究经理

2006年,加入高通公司

研究领域:

图像与视频压缩、率失真优化、运动估计、变换与滤波器设计、标量量化和熵编码。

重要贡献:

在过去二十余年间持续推动数据编码算法的进步,使视频文件能在可察觉图像质量无损的情况下压缩1,000倍。使得在移动终端上传输高质量视频流、举行视频会议和使用虚拟/增强现实成为可能。

1999年至2003年间,她开发了市场上最常用视频编解码器“高级视频编码”(AVC) 的关键组件,为广泛使用的AVC标准的开发作出贡献。她开发的编解码器是一种可以将视频文件中的信息精简至计算机重构视频图像所需的最低限度的软件。通过适当的精简,编解码器可以利用现有的网络基础设施以与DVD难以区分的质量进行视频流传输。

2003-2007年间,她为可扩展视频编码(SVC)标准(该技术的扩展)和高效视频编码(HEVC)标准(对编码器/解码器厂商来说更昂贵的扩展)做出重要贡献。目前,她正在为计划于2020年年中发布的通用视频编码(VVC)标准作出贡献。

业余爱好:

购物、散步和游泳,特别是当她需要时间来思考她的研究时。

格言:

“如果你希望从进步中受益,你必须愿意为之做出贡献。”

沈建缘/文