如何在资讯大爆炸时代获得最及时最准确的新闻,以科技和游戏新闻为例

这是一个资讯大爆炸的时代,在移动互联网大潮的推动下,我们每天接触到各种资讯的渠道从电视、报纸和电脑上网等变成了从手机上面的一个个 App 中获取,哦不对,是被推送“塞入”大量的资讯,这其中有的是新闻,有的是本地实用资讯,甚至还有各路八卦消息。

这是时代的潮流,我们躲不过去。然而笔者相信机核的很多读者并不想要诸如娱乐圈八卦这样的杂七杂八的新闻,只想看游戏相关的资讯;或者是嫌弃各路媒体速度还不够快,自己想成为最快的资讯大佬;抑或者是想要绕过媒体这层中介去获取最原始的消息。那么该怎么做呢?本文就以科技、游戏新闻为例,简单介绍一种方法和三种常见的误导手段,帮助大家获得更高质量的新闻。

很大比例的新闻都是通过官方网站向外发布的

媒体的消息源头是怎么来的呢?一些是提前发送给媒体的新闻稿,这些一般人是搞不到的,因为绝大多数提前发送给媒体的新闻稿会带上 NDA,但以这种形式出现的新闻只是少数,因为也只有比较大的公司才会有较为全面的媒体覆盖。另外很大比例的新闻其实是来自于第一时间发布在公司官方网站上的新闻稿,这种做法较为通行,各行各业基本上都会采用这种做法,科技和游戏行业就更是如此了。另外,对于科技和游戏行业来说,还有一部分新闻是各种传闻(Rumor),这种不确定的消息一般是媒体(尤其是国外媒体)挖掘出来广而告之的。

FromSoftware 的新闻稿页面

所以对于我们普通网民来说,可以通过访问公司官方网站来获取最为及时最为准确的消息。不过很多公司都不会把自己发布的最新消息给挂到首页去,那该怎么找到发布新闻的地方呢?

这里教一招很简单的:利用搜索引擎,用“公司名 Press Release”、“公司名 News”这样的关键词来搜索,这招可以说是屡试不爽。当然也有像 Steam 这种把新消息全当成博文发的,这时候关键词就要换成“Blog”了:

Steam 新闻页中的 Press Releases 已经很久没更新了
近一年半新的官方消息都直接写博文了

而对于一些传言新闻来说,越是靠谱的媒体拿到的内部消息一般会更准确,此时就要选对正确的媒体,对于游戏领域的传闻来说,KotakuPolygon 这两家的爆料新闻准确度还算不错。

那么这么多网站,我总不可能每天就盯着页面刷新等新闻吧,那该怎么将这么多网站和媒体整合到一起看呢?这时候就要请出一个默默在背后奉献了很久的协议——RSS,关于它的介绍请看后文。

精准溯源,拒绝二手错误新闻

当然绝大多数人是没有时时刻刻盯着最新新闻这个必要的,而且就游戏这块来说,国内的几家游戏媒体都是比较及时的,准确性也是比较高的。但科技媒体的新闻就相对要鱼龙混杂一些,这时候就需要我们具有一定的溯源能力,绕过二手新闻。

不准确的翻译可能会带来误解

由于语言隔阂和时差,一般我们通过国内媒体看到的国外科技、游戏公司的新闻都是经过编译,或者直接就是转述的。在编译和转述过程中,很可能就会出现信息失真的现象,最终误导读者,比较常见的就是拿捏不准英文多义词、专业名词或是直接机翻导致出错,比如:

Console,一词多意,这里被错误翻译成了“控制台”

直接拿流言做新闻却不加提示

还有就是直接拿传闻、流言来做新闻,但却不在标题或内容中注明这是流言,对读者进行误导,比如下面这条来自于著名传言站 Wccftech 的 Rumor,在编译之后不仅标题中用于提醒读者的“传言”二字不见了,内文也没有相应的提醒:

到了某媒体那儿,流言提示就没了,变成肯定了

当看到这类新闻的时候,一定要小心,如果你觉得这事情不太对,那么大可稍微小花一点点时间去溯源。国内做的好的媒体都会注明消息出处,点进去稍微读一下,既可以通过原文来理清楚事情原委还能顺便锻炼一下自己的英文阅读能力。如果是没有标明出处的……非一手的新闻就直接拉黑吧。

标题党

这是笔者最为痛恨的一种现象,但不可否认的是,一个非常在我们看来可能是离谱的标题往往可以吸引到很多一般通过路人。标题党在微博、微信朋友圈非常有优势,很多人真的就只看一个标题然后就转发了,实际内容如何呢?不知道没看过没兴趣。

不点名了,都是友媒

这种现象还挺常见的,不过国内几家比较正经的游戏媒体都没有用,这是好的。现在的标题党已经没有以前那么明显了,但是仍然存在曲解文章内容、断章取义这样的情况,所以如果各位读者遇到了一个较为夸张的标题,请务必粗看一下内容以防止被标题带着走了。

定制自己想看的新闻:RSS

上文提到了一个名词,RSS。它定义了一种标准格式,网站可以依照这种标准格式将自己站里面的内容写成一个文件,方便用户抓取网站上面的内容。在 RSS 的帮助下,我们可以用相应的软件从不同的站点上面抓取整理好的内容,直接在一个地方阅读,大大提高了聚合度和效率。其实今天的诸多新闻客户端继承的就是 RSS 的聚合理念,但 RSS 的自由度要更大一些,并且内容也不局限于新闻,所以我们完全可以利用它来打造自己的“新闻客户端”。

目前各个平台上有数量繁多的 RSS 客户端,用的人比较多的有 Feedly、Inoreader 这些,笔者用 Inoreader 比较多,它的免费版基本够用,而且 App 做的挺不错的,比较符合笔者的需求。

那么哪里可以找到 RSS 呢?一般可以留意一下这个标志:

比如在 SIE 的首页,就有一个很明显的 RSS 标记,它超链接到 RSS 文件的地址上,复制这个链接,扔到 RSS 阅读器里面订阅就行了。

很多公司的官网都会提供 RSS,在浏览时可以留意一下。

一些网站也会把 RSS 通道做到页面底部去,比如机核就是

通过一段时间的积累,基本上可以拥有一个稳定的 RSS 源列表,RSS 阅读器会自动按照一定的时间间隔抓取各个订阅站点的 RSS 文件,并把更新的内容展示给你,下图就是笔者积累一段时间之后,RSS 阅读器中订阅的游戏媒体。

这样子做出来的“新闻客户端”具有明显的个人风格,并且有一点很重要的是,你可以摆脱原本各种新闻 App 的推送,看自己想看的媒体,读自己想读的新闻。

结语

网络让我们拥有了更多的信息获取渠道,有了更快的信息获取速度,但不可否认的是,我们在信息的真伪确认上面越发的陷入困境。自媒体的兴起让传统媒体的双重信源确认制度在这个时代显得滞后,但也仍然有 AnandTech 这样对流言坚守双重信源确认的老牌科技媒体,还有像机核这样能够为了新闻报道失实而诚恳道歉的媒体。我相信即使大环境再差,也一定(在新闻上)坚守自己节操的媒体。

希望本文能够起一个抛砖引玉的作用,也希望各位读者朋友在今后,尤其是目前这段特殊时期中,擦亮自己的眼睛,不被谣言所害。

如何面对传闻和流言做新闻?

大学在校期间我有幸接触到了《The Newsroom》这部优秀的不像是美剧的电视剧,在2018年的时候,我曾经写过一点粗浅的观后感,但其实并没有写完,写到中途便草草收尾了事了。但是《The Newsroom》对我的影响比我预想的还要大一些,可以说这部电视剧正是把我推向媒体行业的最大推手,我现在正秉承了这部剧教给我的“如何做新闻”尽可能地高要求自己,尽管我只是一个小小的硬件数码编辑,但我仍然想给自己的读者提供最新、最快并且最为准确的新闻。

而今天读到了Ian Cutress所写的《TRX80 and WRX80 Don’t Exist: Neither Does the ‘Intel LGA1159’ Socket》,文中他介绍他们AnandTech的新闻原则还是保留了新闻界的传统——双重信源:

Here at AnandTech, we often use at least two sources for any particular story, preferably both primary sources.

这个名词是我擅自归纳的,意思就是一条传言如果被两个可靠的信源确认,那就可以当作真实新闻处理。当然AnandTech的严谨程度并没有专业的电视媒体那么高,但是相对于我们国内的很多硬件媒体,他们的要求已经很高了。

在进入行业之前,我很好奇,每天这么多传闻都是从哪里挖出来的。直到自己开始写新闻才发现,原来Twitter爆料人的一句话甚至是一个单词都可以扩写成一条新闻,实际上我们并没有办法去确认这些爆料的真实程度,所幸的是他们一般都是在有把握的情况下才发的,我们的报道最终也没有出现太多的偏差。

我们需要判断信息的可靠性,作为信息传递的放大环节,媒体应该尽量做到不失真。我们可以带着一些主观看法去写评论,但是新闻的基本事实必须是明确的、可靠的。

科技媒体都在吃二手屎,比那些自媒体慢一步,但又不能保证自己的消息完全是可靠的,那为什么还要来看你呢?现在的很多媒体靠的是独家新闻来吸引读者,但我们这种体量的媒体还做不到所谓的独家新闻,只能靠速度、准确度和专业程度来吸引读者了,速度由于码字还不够快确实赶不上,那就只能通过提升后两者来提高自己新闻的质量了。

>>endl;

也谈视频网站VVIP问题

上个月有个名词闹得全网沸沸扬扬——《庆余年》,倒也不是这部电视剧本身引发了热烈讨论,而是它的播放平台闹了不小的动静,我们来简单回顾一下事件的经过:

2019年11月26日,《庆余年》正式在腾讯视频以及爱奇艺两家视频网站上线,采用了与之前不少电视剧相似的播放策略——每周一、二、三20:00更新2集、VIP会员抢先看6集,这并没有什么问题。

2019年12月11日,似乎是看到《庆余年》热度的升高,抑或是出于其他什么原因,腾讯视频和爱奇艺为此剧推出VIP专享付费超前点播服务,VIP会员可以通过一次性的50元付费,在每周更新日领先非会员6集的基础上再多抢先看6集。此举一出,被国内视频网站百般花样影响收看体验的用户马上就不乐意了,通过各种SNS抒发自己的愤懑,此事让万千媒体经过添油加醋,最终引得官方媒体为用户发声,视频网站最终低头承认考虑不周

视频网站会员并不是一个新东西,作为国内的“订阅制服务”变种,它可以让交了费的用户享受到更好的画质,更好的观看体验,更多的内容访问权,但事实真的是这样子的吗?

最早视频网站在推出会员服务的时候确实将开头的广告给去掉了,但慢慢的,他们通过各种各样的方式让本该享受无广告体验的付费会员们也看上了广告,各种播放中植入广告,什么贴片广告。今年九月份,就有《钱江晚报》对腾讯视频、爱奇艺、优酷、芒果TV、搜狐视频、腾讯体育等九大视频网站进行了体验,该文章被新华网转载,针对广告内容,我引用文章的原话:

省消保委相关负责人告诉钱江晚报记者,他们通过暗访发现,大部分视频网站对会员免广告的描述五花八门。比如,“广告特权”、“跳广告”、“免广告”,但在实际体验中发现,在腾讯、爱奇艺、芒果TV等网站成为会员后,依然可以看到开屏广告、弹窗广告、页面广告、会员广告、暂停页面广告等;优酷有开屏、页面、暂停页面广告;搜狐视频可以看到会员广告;PP视频可以看到开屏和页面广告;乐视可以看到开屏和暂停页面广告等。

为什么明明已经“免广告”,还有这样多种多样的广告方式?体验人员告诉钱江晚报记者,他们也是仔细查看会员协议才发现其中的猫腻——所谓的“免广告”、“跳广告”仅仅是免去或跳过视频开始的片头广告,但这一点在开通会员的页面上并没有明示。

更有个例让人有些无奈,比如,腾讯视频“小剧场广告”。体验人员在观看腾讯自制剧《怒晴湘西》时发现,每集中间部分都会穿插由剧中原班人马出演,强行穿插在剧情里的腾讯微视广告,“虽然可以手动快进,但不能关闭。”调查人员对此也是一番苦笑。

诚然,视频网站为了提高自己的收入弥补自己的亏损,在网站/App的各种地方植入广告是合乎情理的,但对于付费会员来说,这就是收了他们的钱,然后再跟他们说这钱只能用在去掉开头广告上,其他广告你得跟普通用户一样照看,那么他们的心理会不会产生不值得的感觉?这是不是在降低付费用户的体验?

要说用户体验的话,我想B站应该算是国内视频网站中矮个儿中拔尖的。至少多年前食言推出大会员服务至今,他们仍然没有添加贴片广告,非付费用户也能够以相对能够接受的画质观看视频, 而付费会员则是可以用比较合理的资费获得更高的画质以及更多内容的访问权,至少这个大会员我买的是挺满意的。

而再看国外的同类网站,比如一大巨头Netflix,虽然贵,但是它的内容质量和使用体验(当然是在可以流畅观看的前提下)不会让用户感觉到不值得,简单一个例子就是它的高清真的是实打实的1080p,超高清就是真的是UHD,也就是4K,而不像国内视频网站那样挂羊头卖狗肉,在分辨率上缩水或是欠码。

我们不是不愿意为内容付费,回头看看国内的正版游戏推广就知道了,为什么大家都愿意去Steam上面买游戏?最主要的恐怕就是它的用户体验做的好,购买简单,下载又快,比以前自己去找盗版还要简单(当然还有便宜)。而视频网站呢?付了费之后得到的是如此糟糕的用户体验,甚至还要二段式收费,那必然有部分用户会不愿意掏钱,而选择自行寻找盗版资源。“反正我要看的也就是那部剧嘛,其他内容送我都不要”,这可能是一些观众的真实想法,也折射出国内视频网站在内容吸引力上面的匮乏。当然,国内的大环境使得优质原创内容的出现概率并不高,这也是客观存在的事实。该如何提高用户的付费率呢?视频网站想出了一招付费提前看更多,并且尝试了一下感觉还行,就用在这次的《庆余年》身上了,结果这批观众不忍了,于是事件就这么爆发了。

用户是用脚投票的。你给我好的内容、好的用户体验,我自然会心甘情愿地掏钱留下来,而如果你的内容对我没吸引力了,用户体验变差了,那我还每个月续着你干嘛?现在视频网站的内容质量可能需要很长时间才能有明显的改善,那么是不是能够从用户体验出发,至少让付费用户看得更舒服一些,弥合用户与网站之间越来越大的裂痕,不要再赶走这些提供着不菲运营资金的“优质用户”了。

音频编码变迁录

前面讲过了多媒体容器格式的变迁,这期我们来看看音频编码是如何发展的。在讲编码之前,同样地,让我们来看看现在最为通用的数字音频格式——PCM是怎么来的吧。

从音频波形到0和1

声波是一种机械波,在数字时代到来前,录音的原理其实就是将声波的波形、振幅等等特征依样画葫芦给记录到如黑胶唱片、磁带等介质上面,但是这种记录方式并不利于保存,计算机等电子设备的普及使得人们更想使用电子数据的方式来保存音频。但是用于采集声音的麦克风最终将声波转换输出的电流是一种模拟信号,它用电流的大小来表示声波,是连续的;而计算机使用的数字信号系统是一种离散的、非连续的信号系统,在常见的二进制系统中,它只有0和1两种状态,并不能够直接保存模拟信号,两者之间需要经过转换。

怎么转换呢?首先针对一段声音的音频波形,我们可以用一个较为复杂的波形函数来表示,既然它是函数,那让我们回想一下初中高中大学我们都是怎么把函数画出来的,用线把一个个点连接到一起对不对?那么现在我们反过来,在这条已经给定的函数图像上面按照一定的间隔取点,这个过程就叫做采样,取完点之后把它的值用数字给记录下来,这就叫做量化。


在音频编辑软件中将音频波形放大,你可以看到一个个取样点

这种将声波记录成数字数据的方式就叫做PCM调制,这里说的很简化,但是原理其实是一样的,就是用记录下来的点去拟合出声波函数应该有的样子,在PCM调制中,我们记录到的数据是时间与对应的电平值。而上面这两个操作就带来了**采样频率**和**量化位数**这两个关键特征。

PCM调制下的音频重要特征


一个波形函数,上面的红点代表采样点,两个红点之间的横向距离一致,距离值就是采样频率的倒数
量化要做的就是将这个红点的y值以一定的规则记录下来

采样频率

由于声波是一种连续的信号,你可以把它看成数学上面的连续函数,从一个点到下一个点之间有无数多个点,我们没有办法全部将这些时间-振幅信息100%记录下来,只能从中挑选一些,那么怎么挑选呢?以一个固定的时间间隔,到点了就记录。而采样频率指的就是每秒记录这些值的次数,用Hz作为单位。

采样频率越高,我们记录下来的原始声波信息越多,我们保存下来的数字信号自然就越贴近于原始音频信号。

量化位数

在确定了采样次数后,我们在这条声波函数上面拥有了一些间隔相同的点,我们知道,在二维函数上面的点可以用一组二维坐标值来表示,这里横轴是时间t,而纵轴一般就是电平值,因为计算机处理能力的限制,我们不可能用一个无限长的数字去记录它,只能用有限位数的数字去记录,而这个位数就是“量化位数”,它决定了数字音频信号的量化精度。

因为这种记录方式用的是近似值的方法,所以量化位数越大,我们记录下的原始模拟信号的电平值就越精确、越贴近于原始音频信号,另外量化位数越大的音频在动态范围上也要比量化位数小的音频要大。

以音频CD为标尺的无损、有损以及Hi-Res

因为数字信号系统记录下的音频信号已经经过了一次采样了,相对于原始的模拟音频信号它已经是“有损”的了,所以我们今天常说的有损无损指的是有损压缩和无损压缩(可以是无压缩)的区别。顾名思义,无损压缩指的是数据在经过压缩之后没有任何的损失,而有损压缩则相对,它在压缩过后相对于原始数据出现了损失。

而原始数据是什么呢?那就要讲到开启人类数字音频时代的CD。

CD:光、数字、音乐

在上个世纪五六十年代,人们常用的还是黑胶唱片,而随着1965年光盘的问世,这种比黑胶唱片更加小巧精致的记录载体很快受到了大公司的青睐,其中飞利浦和Sony就决定用光盘作为记录数字音频数据的载体,并为它量身定做一种数字音频记录格式,最终他们决定采用LPCM——线性PCM作为编码。

然后飞利浦和Sony这两家在CD要使用的LPCM编码具体参数,也就是采样频率和量化位数上面产生了分歧,进行了一段长时间的拉锯战。

首先因为人耳普遍只能够辨识频率在20Hz~20kHz之间的声音,而根据奈奎斯特–香农采样定理,对于一个连续信号,只要采样率高于(注意,不能等于)原信号带宽的两倍即可通过采样完美(理论上的)重建原信号,所以CD标准的采样频率先被确定到要在40kHz以上。根据这个底线,飞利浦那边提出的标准是44056Hz/14-bit,而Sony则是使用44100Hz/16-bit的标准,双方都是站在自己的利益角度,两种标准都是为保留与原本的电视、录像带系统(NTSC/PAL)的兼容性而提出的。

最终拉锯战以Sony方面的大获全胜而告终,CD音频以44.1kHz/16-bit的双声道LPCM的形式进行记录,这就是Compact Disc Digital Audio(CDDA)标准,它于1980年定稿。

回到我们上面所说的无损、有损的概念。由于CD是我们最早普及的数字音频记录系统,它也是我们普通人能够接触到的最接近原始音频的介质(先不论Hi-Res),所以大家就开始用“无损”来称呼原始的从音频CD上面保存下来的数据,当然它也可以用于无损压缩过的音频。

Hi-Res

CD标准确定之后,它逐渐变成了音乐发行使用的主要介质,但随着时代的发展,有需求的人们还是发现它不够用了,首先16-bit的量化位数限制了CD音频的动态范围,其次44.1kHz的采样频率仍然会在模拟转数字过程中产生人耳可闻的损失。所以制定一种比CD更高的标准就成为了业界的共识。

从CD诞生到现在的短短四十年中,包括它的创造者Sony和飞利浦在内,一直都有新的厂商想要以自己更新更好的编码标准取代掉CD标准,但很可惜他们的努力都没有成功,CD仍然牢牢地占据着业界。虽然没有成功,但这些努力还是引起了行业协会的重视。2014年,美国唱片业协会(RIAA)这家代表着美国唱片业的贸易团体联合了其他几个较为权威的组织一起给比CD更高的音频制式下了定义

Lossless audio capable of reproducing the full spectrum of sound from recordings which have been mastered from better than CD quality (48kHz/20-bit or higher) music sources which represent what the artists, producers and engineers originally intended.

也就是说,采样频率/量化位数在48kHz/20-bit或其上的音频都可以被称之为”High Resolution Music”,简称就是Hi-Res Music。


RIAA的Hi-Res Music Logo

其实在RIAA之前,日本的電子情報技術産業協会(JEITA)在2013年[制定](/images/https://www.jas-audio.or.jp/english/hi-res-logo-en)了一套适用于日本国内的Hi-Res标准,这套标准规定了Hi-Res音频在模拟和数字处理过程中必须参照使用的规范,其中对于数字处理过程,JEITA要求全过程的音频格式均在96kHz/24-bit及之上。


这个Logo也是我们现在能看到最多的代表Hi-Res的Logo。

而这套标准也被日本的音频器材行业带向了全球。

常用的有损音频编码

一张CD翻录下来的大小总会有个500、600MB吧,对于上个世纪90年代还在使用以几MB为单位的软盘的人们来说显然是太大了,另外网络时代早期的带宽还是非常小的,比如当年拨号上网最快也就只有56kbps的带宽,如果想将CD保存到自己电脑里,或者是通过网络跟人分享,在当时几乎是一件不可能的事情。

而有些人说那为什么不做压缩呢?因为在数据压缩软件看来,你这个CD文件的数据几乎没有冗余,传统的数据压缩方式对音频数据是起不了太大效果的,那咋办呢?只能走有损编码的道路了,这其中,MP3是比较早、也是人们用的最多的有损音频编码。

MP3:最常用的,不一定是最好的

MP3的全称为MPEG-1 Audio Layer III,也可以是MPEG-2 Audio Layer III,它是在1993年被标准化的,至今已经有26年的历史了。别看它的岁数大,但它应用的音频压缩思想至今仍然在音频编码领域中发挥着重要的作用。

首先,MP3使用了MDCT算法,这种算法改正了原始DCT算法上面的一些缺点,它将音频原本的时域信息转换成频域信息,是之后对不同频段信号进行处理的前提。

其次,MP3运用了声音心理学模型,这里有三点。第一,人的听觉频率范围大概在20Hz~20kHz,所以可以多去掉一些高频声音;第二,人耳对于不同频率声音的敏感程度不同,大概在2000Hz~5000Hz之间是最灵敏的,而在两端下降的比较厉害,尤其是高频;第三,人耳听声音有遮蔽效应,一个较强的声音会遮蔽掉较弱的声音,比如说手机开同样的音量在闹市中和在自己房中听起来完全是两码事,另外不同频率声音的遮蔽宽度不同。根据以上三点,MP3编码器就可以对不同频段的音频信号进行取舍,给人耳比较敏感的频段多保留一些细节,而去掉人耳不敏感甚至会听不见的一些声音。

最后,MP3运用了哈夫曼算法来对处理过后的音频数据进行压缩,并且编码器会不断地对前面的处理进行调整,以达到用户给出的码率、质量需求。

由于以上三个大的特点还有别的没有提到的原因,MP3在压缩之后仍然拥有相当高的质量,而压缩比一点都不差,大概在1:4~1:6之间,最高可能有个1:10。因此这个已经有26年历史的编码标准时至今日仍未过时,大量在网络上进行传播的音频仍然使用着它,但它并不是没有缺点。

一是它太狠了,对于20kHz以上的声音几乎就是一刀切,比如下面这张图就是一段320kbps CBR编码的MP3音频频谱图,可以看到20kHz上面完全消失了,这种情况主要出现在CBR编码的MP3上面。


使用CBR 320kbps参数进行编码,可以看到编码后的音频频率上限就是20kHz

当然你也可以强行关闭编码器的一刀切行为。


这是开启使用最高品质VBR编码的MP3频谱,可以看到20kHz以上是完整的

一刀切虽然可以大幅减少音频文件的体积,但在实际听感上总会感觉缺了什么。

第二个缺点,其实也不能算是MP3编码自身的缺点而是它使用的标签有问题。肯定有用户在下载网上的MP3资源时遇到过乱码问题,比如:

这是因为MP3文件使用的ID3标签最初没有统一的文本编码,各种语言的系统会以自己当前使用的文本编码标准往里面写数据,导致使用其他文本编码标准的系统无法正确读取文本数据,最终出现乱码。比如图上这个MP3的信息就是日文系统用Shift-JIS文本编码写入的,而我们平时使用的简体中文Windows的文本编码标准是GBK,无法正确读取,所以出现了乱码。ID3标签在之后的v2版本中改进了这一点。

第三个问题是MP3对于多声道的支持较差,常用的MPEG-1 Audio Layer III标准只支持双声道音频,而非主流的MPEG-2 Audio Layer III才支持最高5.1声道,但是它最高只能够支持采样率为24kHz的音频,完全不够用。

其他的缺点可能算不上什么大问题,不然它也不会被用到今天仍然是主流了。

AAC:先进、优秀,但是没能取代MP3

AAC名叫进阶音频编码(Advanced Audio Coding),它本来是开发出来取代MP3的。联合起来开发它的公司有一大堆,个个都是知名大企业或研究机构,比如索尼、微软、杜比实验室、贝尔实验室,等等等等。最终,AAC被MPEG组织接受,写进了他们的MPEG-2和MPEG-4标准中。

相对于MP3,AAC使用了完整的MDCT算法,因此在编码效率上它更胜一筹,一般在同等码率下,AAC的质量比MP3更好一些。而其他的改进点还有支持更大范围的采样率(16~48kHz=>8~96kHz),最多支持高达48个声道,在对频率高于16kHz的音频处理上明显要好等。总之,作为设计目的是取代MP3的编码,它的特性非常优秀,然而,AAC没有如愿以偿的成功取代掉MP3,究其原因可能还是推广力度不够大。另外,尽管用户无需为使用AAC格式进行流式传输或分发而付费,但硬件制造商和软件开发者需要交这笔钱,专利费用也使得在AAC标准确定之初,普通用户手上根本没有能用的AAC编码器,而在这时候,MP3和著名的LAME编码器已经满天下都是了。

实际上我们现在的日常生活中AAC可以说是无处不在的,在线视频的“业界规范”就是以它作为音频编码标准,所以你随便点开一个在线视频,基本上就会听到用AAC编码的音频。另外一个主力推广AAC的公司就是苹果,早在iTunes商店建立之初,他们就使用AAC作为这个数字音乐商店的音频编码标准了,一直到今天都是,包括在前几年推出的Apple Music流媒体服务。

AAC使用两种容器,一般我们见到的都是以.m4a为扩展名的文件,其实就是mp4。而因为使用mp4容器,文件的元数据使用UTF-8编码保存,所以不会出现如MP3那样的乱码。另一种容器现在比较少见,直接以.aac为扩展名,实际上是一种名为ADTS的容器。

除了以上的特性之外,AAC的编码还是可以模块化定制的,在MPEG-2 Part 7中就已经给出了三种模块化编码方式,而到了更加现代化的MPEG-4 Part 3规范中,更是给出了多达11种模块化配置规范,其中不乏有低延迟模式和高效模式(HE-AAC),下面就简单提一下AAC-LC和HE-AAC。

AAC-LC与HE-AAC

AAC-LC,或者叫低复杂度(Low Complexity)AAC,你可以将它看成是原版的AAC编码,它的编码规范写在MPEG-2 Part 7中,在MPEG-4 Part 3中就直接叫做AAC Profile,而HE-AAC全称High-Efficiency AAC,直译就是高效AAC,它的编码规范写在MPEG-4 Part 3中。主要区别是HE-AAC利用了一些新特性,在编码效率上有明显的提高,特别是在低码率情况下。

简单的关系图如上,可以看到HE-AAC包含了很多新特性,这些新特性帮助它实现了更高的压缩比。

WMA:规格很先进,但它是微软的东西

早个十五年,我们在百度上搜索音乐下载的时候,除了MP3,见得最多的一种格式应该就是WMA了,看到开头的WM两个字母就能明白,这是微软的格式。没错,这是“鼎盛”时期的微软开发并强力推广的专有编码,多见于Windows平台。微软最初开发出它的目的很简单,就是为了和MP3和RealAudio竞争,结果大家都知道了,MP3活到了今天,而WMA和RealAudio都已经消逝在历史长河中了。

WMA全称Windows Media Audio,它同样使用了音频心理学对原始音频进行处理,去除人耳不敏感的声音来减小数据体积,思路与MP3大同小异,不过具体实现上面有差异。WMA是与Windows Media紧紧捆绑的一种音频编码格式,不过微软将编解码开放给了第三方,交钱就可以用,所以在十多年前的MP3播放器上我们也可以播放WMA格式的音频。WMA与Windows Media一起升级,它还有个增强版,就是WMA Pro。我们比较熟悉的可能是Windows XP SP2自带的那个Windows Media Player 9.0,实际上在这个版本中,微软还为WMA引入了无损编码,称为WMA Lossless。


Windows 10还带着Windows Media Player,但还有人用吗?

但是随着微软在多媒体格式竞争中的全面失败,Windows Media也不再更新了,WMA也就慢慢的不再流行了。

Dolby Digital(AC-3)与DTS:电影工业的常客

VCD上面用的MP1音频编码效果太差了,还不支持多声道,但这也是因为CD的容量不够大,而从DVD开始,人们终于有机会在自己家里听到影院级别的音效了,因为它的容量足以直接收录电影使用的Dolby Digital或者DTS音频。那么这两种音频是什么呢?先来说Dolby Digital,我们可能更熟知它的另一个名字:AC-3。

Dolby Digital(AC-3)

Dolby实验室是美国一家专注于音频效果、音频编解码领域的公司,原本在模拟时代,它发明的一系列音频编码已经被好莱坞广泛使用,人们在电影院里面最常听到的就是用Dolby技术编码而成的声音。而到了数字时代,他们也紧跟潮流,于1991年推出了Dolby Digital这种数字音频编码。

Dolby Digital的开创性在于它是首个使用MDCT算法进行压缩的编码,同时他们还使用了音频心理学的研究成果对压缩算法进行优化,使得最终压缩后的产物仍然拥有影院级别的效果,但是DD只支持固定码率编码,这使得它的码率一般都会比较高,所以压缩过后的音频体积也较大。常见的DD编码一般有6个声道,称为DD 5.1,而在很多DVD上面我们经常可以看到它的Logo。DD音频的另外一个特点是它的元数据中带有对解码过程进行控制的相关信息,使得它在支持的播放器上可以还原出制片方想要的效果。

随后DD又发展出了很多新分支,其中比较有名的是Dolby Digital Live,它随着另一家老牌音频硬件公司——创新——进入了千家万户。而DD也有自己的后继者——Dolby Digital Plus,我们可能更熟悉它的另一个名字——E-AC-3,它在DD的基础上提升了比特率和声道数量,我们经常可以在下载版的美剧中见到这种编码。

DTS

在电影音频领域中,另一家影响力很广,技术力很强的公司就是DTS了,DVD时代我们经常见到的就是他们以公司名命名的音频编码格式DTS,这种编码推出于1993年,直接竞争对手就是Dolby实验室的产品。

与Dolby Digital选择使用MDCT算法不同的是,DTS选择了ADPCM作为算法基础,这种算法是PCM的变种,与PCM使用固定量化位数记录电平值不同的是,ADPCM有自适应的特征,在音频电平差值较小时用较少的量化位数去记录,而差值大的时候用更多的量化位数进行记录,这样对于存储空间的利用率就更高了,相对于用MDCT算法算出不同的频率段再砍掉人耳不敏感部分的做法,基于ADPCM算法的编码虽然压缩率要低一些,但是对于声音细节的保留肯定是它要做的更好。当然,这就使得它的体积控制比DD要差一些,所以在一般的DVD上,我们更常见到的是DD而不是DTS。


好莱坞电影真的是以Dobly编码居多的

Dolby实验室与DTS的竞争从这时候的DD与DTS开始,一直延续到今天的Dolby TrueHD VS. DTS-HD Master Audio,后面两个都已经是无损编码了,我们放到下面去讲。

Vorbis与Opus:多见于语音编码

说Vorbis这个名字可能大家都不知道是啥,但是一说Ogg那肯定都会“啊我知道”了。其实Ogg是Vorbis编码的音频常用的一种容器,而Vorbis编码则是在2000年公布的一种计划取代所有有损音频压缩的编码,对,它的野心极大。

Vorbis编码的原理与其他有损编码相比也是大同小异,基于MDCT的时频转换,然后过心理声学进行频段舍弃,不过之后的处理有些不同,它使用矢量量化算法,在低码率情况下有着很好的表现,接近于HE-AAC,但没能完成超越。前面也说了,直到今天MP3也仍然稳坐着音频领域第一编码的位置,所以很明显Vorbis没有完成自己的计划。

之后它的主要开发者Xiph.Org基金会又推出了一种新的编码——Opus,这种编码有着比Vorbis更好的低码率表现,在同码率下终于实现了对HE-AAC的超越。而它还有一个低时延的特性,可以做到目前最低的编码延迟,这也使得它在数字语音通信领域中大放异彩,它现在也是IETF标准中的一员。

常见的无损音频编码

在自己的硬盘空间逐渐大到放CD原盘都没有问题了之后,新的问题出现了,网速跟不上。回想一下05年左右,国内家庭普遍还是在用ADSL上网,速率可能也就只有1~2Mbps,用这个速度下点MP3还行,但是下原盘就太慢了,但很多音乐爱好者就是想收藏“没有瑕疵”的无损音频,怎么办呢?这时无损音频压缩编码走上了舞台,首先登场的是Monkey’s Audio,又叫APE。

APE:无损音频压缩的先行者

APE是Monkey’s Audio这个编码使用的扩展名,但是叫得多了大家都只知道APE而不知道Monkey’s Audio了。它是可考的、比较早出现的一种无损音频编码,后面要提到的WavPack(.wv)比它出现的还要早,但是APE却是头一个大范围流行起来的无损音频编码,最初版本公开于2000年。

问题来了,前面不是说对传统压缩方式对于音频数据并不能起到很好的效果吗?那APE是怎么在无损的情况下实现如此高的压缩率的?答案也很简单,传统方式不行,那我就用新的针对性算法呗。

APE主要使用了三大算法来实现对原始音频数据的无损压缩,第一个是Joint Coding,简单说就是将左右两个声道的共同信息进行复用,从而减小音频体积;第二个是线性预测编码(Linear Predictive Coding),因为音频信号前后关联性非常大,可以根据前面一段音频波形预测后面的音频波形,如果预测得到的值与真实值有差距,则对差值进行编码,这种算法是音频无损编码的核心杀手级算法,可以做到在没有损失的情况下大幅提升压缩比;第三个就是预测编码所需要的量化位数。

这三种主要算法使得APE可以在没有损失的情况下达到约50%的压缩比,这是之前的无损音频编码做不到的事情。

但是APE也有较大的缺陷,最高只支持双声道、24-bit的量化位数让它在新世代落后于FLAC,因为存在浮点计算,所以对硬件性能的需求要高于FLAC,在编解码上面也更慢,而它也没有针对数据完整性做

另外由于APE虽然标了自由软件,但是它使用的许可证并不能让人们直接使用Monkey’s Audio现成的源代码,必须自行动手去实现对它的解码支持,这也限制了它的应用范围。

FLAC:免费开放,新的业界事实标准

FLAC基本上是与APE同时间提出来的,稍微晚了那么一丢丢,它直接将编码的最大特点写在自己的名字里了——Free Lossless Audio Codec,自由、无损。

相对于APE,虽然同样使用了线性预测算法,但它的压缩比稍微差了一点,不过由于FLAC使用全整数的数据计算方式,所以低端电子设备也可轻松对其进行解码,而它在数据结构上考虑到了数据完整性和流传输,它采用帧结构设计确保了即使文件的部分片段遭遇不测,其他部分也能够正常播放,而支持流传输的特性使得它在可以在流媒体时代占据一席之地。并且它对于多声道的支持比APE强很多,最高可以支持8声道。

FLAC身上的种种优点使得它成为了目前最为流行的无损音频压缩编码,Android早就添加了对于FLAC的支持,而iOS也在第11个大版本中放下自己的矜持加入了对它的支持。FLAC已经俨然成为了新的业界通用编码,各大Hi-Res音乐售卖网站也在使用FLAC作为载体传播Hi-Res及普通无损音乐。

Apple Lossless(ALAC)

macOS作为很多音频编辑软件使用的系统环境,对于音频编码自然也是有着很高的要求,其实苹果自己也很早就跟进了无损音频的发展,在2004年的时候他们就推出了自己的无损音频压缩编码——Apple Lossless,但是当时这种格式只有苹果自家的系统和软件才能支持,并且会收取授权费用,这也导致了ALAC错过了无损音频开始发展的萌芽期,直到2011年,FLAC已经成为市场主流的情况下,苹果才将ALAC开放出来,并且取消了它的专利费用。

ALAC在编码方式上与其他几种无损音频压缩编码并没有太大的区别,同样是基于线性预测的算法,不过它的编码器连个压缩率选项都不提供,但编码速度确实挺快的。ALAC与AAC一样使用MP4作为数据容器,所以也继承了MP4良好的标签支持。

但是它的使用范围始终不广,本来就基本限定于苹果设备上,而在iOS和macOS纷纷支持FLAC之后,它的存在意义就更小了。

Dolby TrueHD与DTS-HD Master Audio:蓝光时代电影常用音频编码,新的战场

从DVD到蓝光是一次大的飞跃,光盘这种存储介质在新的蓝色激光的帮助下,大幅度提升了存储密度,也使得它可以记录体积更为庞大的音频,有了大的空间,那肯定就要上无损啊,其实蓝光的容量已经足够放7.1声道、48kHz/24-bit的LPCM了,但是它的体积还是太大,所以Dolby和DTS不约而同的在高清时代推出了新版的音频压缩编码技术,Dolby这边是以Dolby TrueHD系列为主,而DTS是以DTS-HD Master Audio为主,两边都是无损压缩技术,这边就讲的粗略一些了。

Dolby TrueHD

Dolby TrueHD使用与DVD-Audio相同的MLP编码对原始PCM音频数据进行处理,最高支持192kHz/24-bit的规格,另外还支持16个独立声道。与前任Dolby Digital一样,它也带有用于控制播放过程的元数据,提供更加还原的音频效果,Dolby后来推出的Atmos氛围声效果就是通过这些独立于音轨之外的元数据实现的。

DTS-HD Master Audio

这两种多见于蓝光原盘的音频编码都附带了对原来有损编码的兼容,DTS-HD Master Audio内建了一条有损音轨,称为DTS Core Stream,它的无损部分其实是对有损部分的一个补充,在支持的设备上自动就会播放无损的DTS-HD Master Audio,而在不支持的设备上也可以切换到DTS Core Stream,不会影响到正常的播放,而另一边的Dolby TrueHD则是通过附带一条Dolby Digital音轨的方式来解决兼容性。

DTS-HD Master Audio在日本用的比较多一些,尤其是各种动画小圆盘。

TTK,TAK,WavPack等

除了上面三个稍微多见一点的编码以外,无损音频编码界还有很多其他的编码,由于APE推出时间早、FLAC用的人多等原因,这些无损压缩编码最终都没有推广开来,成为了比较小众的编码,虽然它们可能在某些方面有着优势,但很可惜,时势造英雄,取代英雄没有这么容易。

PDM与DSD:另一种音频调制方式

说起PDM(Pulse Density Modulation 脉冲密度调制)可能没学过数字电路的同学会云里雾里,简单一点的说法就是PDM使用0和1来模拟原始波形,怎么模拟呢?通过在单位时间内0和1的堆叠来进行,因为此时0和1的密度代表了波形的振幅,所以叫做脉冲密度调制,它与PCM记录电平值的做法是完全不同的。

基于PDM调制的原理,Sony和飞利浦在1999年推出了用于取代CD的SACD(Super Audio CD),它使用的ΔΣ算法在模拟/数字转换(A/D)过程中会以64倍于CD的采样率(2.8224MHz)对原始音频进行过采样,而由于PDM的特性,量化位数当然就只有1-bit,因为只有每一个采样点都只有开或者关两种状态嘛。


PCM与DSD的对比

DSD解决了传统PCM编码上的高频量化噪声问题,高采样率同时还带来了更加丰富的声音细节,而密度调制的方式也使得它拥有更大的声音动态范围。除了原始的64倍采样率的DSD之外,后来还推出了DSD128、DSD256、DSD512等新格式,它们的采样率逐步上升。

现在我们可以拿到的DSD音频一般都是ISO镜像格式的,使用专门的解码器可以将其转换成PCM音频播放,而支持DSD直通播放的设备还是相当的贵。

SACD的物理介质其实就是DVD,同期其实还有一个DVD-Audio阵营,他们仍然使用了兼容性较好的PCM调制,不过是基于一种新的名为MLP(Meridian Lossless Packing)编码方式,在双声道情况下最高支持192kHz/24-bit的PCM音频流,直到今天,它的规格都是相当高的。

但是Hi-Fi最终也只是少数人的玩物,它的配套解码器、播放器都太贵了,而且Sony当时为了拉拢唱片发行商做出了“永远不会让PC读取SACD”的承诺(后来他们食言了)也限制了SACD的进一步推广,在面对以iPod、iTunes为代表的数字音乐浪潮时,它和DVD-Audio都只能站在一边看着眼馋,事实证明,绝大多数人们需要的是方便快捷的听歌体验,所以便于携带的各种MP3播放器很快就取代掉了CD成为了新的潮流。而后,就是流媒体取代传统MP3的又一股浪潮,我们现在就身处于这股浪潮之中。

总结

要总结的话就是,MP3和AAC这两种有二十多年历史的编码统治着有损音频编码,而FLAC基本上成为了无损音频编码的事实标准,而电影工业中Dolby和DTS仍然在竞争,目前看上去Dolby更占上风。而在开放软件领域中,Vorbis和Opus这两种开放的格式也慢慢在Web领域中得到大量应用。

其实看到最后,你会发现,本文写到的几种基于PCM调制的无损、有损音频压缩编码基本上都是基于类似的编码——有损压缩很多都是基于MDCT,而无损压缩基于线性预测编码。用烹饪打个比方,原始的PCM音频就是主要原料,你可以把MDCT和线性预测编码看成是不同的主要做法,比如MDCT是炒而LPC是蒸,其他的一些算法就像是对于主要原料的小处理方式,比如先过个水或者是先腌制一下,他们与主要做法一起左右着整道菜的口感和味道,而最终得到的菜的营养价值也根据不同的处理手段而改变。

另外,在有损压缩技术中,心理声学(Psychoacoustics)是一大助力剂,它帮助各种编码对原始音频进行取舍,在对听感影响很小的情况下大幅减少体积。而心理学也不只是在音频编码领域中起着作用,在视频和图像编码中,它同样有着重要的贡献,当然,这就是后话了。

因为各种物理极限和自然定律,数字记录方式永远不可能100%还原出现实,但是人类是不会停止研究、应用新技术的脚步的,数字世界将会越来越接近于现实。

实际上在这个网络流媒体时代,我们的需求也逐渐发生了改变,从怎么样带更多的歌变成了怎么样听得更爽,所以现在对于音频压缩技术还是有不小的需求的,一个更为高效的编码可以在节省网络带宽的同时提高人们听音乐的享受程度,而聚沙成塔,每个人那儿节省一点点的带宽最终聚合起来就可以节省巨大的带宽费用,对于用户本身也可以节省流量,双赢的事情何乐而不为呢?这也是为何我们要追求更高效的媒体压缩方式的一个初衷。

《天气之子》:新海诚的回归

不整那些虚的介绍,直接开始讲这电影。简单地说就是新海诚用这部电影告诉所有人,《你的名字。》只是一个意外,《天气之子》才是他自己真实想做的电影。

相比起《你的名字。》中前半部分还用了时间错位的手法留了个小小悬念稍微让观众要转一下弯,《天气之子》根本就是平铺直叙,开篇就按照时间顺序直接把阳菜如何成为“晴女”的过程给放出来了。

然后镜头一转到男主出场,没有对开头的场景进行任何的解释,女主似乎也不见了一样。本来以为男主会有什么奇特的本事或是什么生存的本领,可没想到他只是离家出走,只身一人来到东京想在大城市中活下去的普通乡下高中生,而同样没有想到新海诚会这么安排这两人的相见——在M记打工的女主看男主多次来餐厅只敢喝汤就送了个汉堡给他。也没有想到女主也同样是社会的弱势群体——她和自己的弟弟一起生活,没有父母只能靠自己去努力挣钱养活自己和弟弟。本来这两人也就是一面之缘的关系,按照现实生活的剧情发展他们俩也不会再有什么交集了,可这是电影。女主被M记辞退之后因为生活所迫在马上要踏入风俗业大门的时候,男主出现把她拐走了,这俩人的命运由此交织在了一起。

我不知道为什么这么多人都喊着对这次的新海诚电影失望了,在我看来,新海诚就应该做出这样的作品——他就想写少男少女之间相遇相离的感情故事,从很久以前开始就一直是,《你的名字。》只不过是在最后又加了一个相遇罢了,然后对于电影整体的把控上面表现得出色,其实它本质上也就是一个浪漫的恋爱故事而已。

当然可能观众会觉得,电影结构太松散,逻辑太不严谨。是,这些在这个大型罗曼蒂克故事里面是问题吗?不是。新海诚就真的只是想写一个爱的意义可以超越拯救世界的故事,拯救世界是什么?能吃吗?有阳菜重要吗?没有。所以男主当然是决定不论如何都要去找到女主,而另一边在女主那边,她肯定是后悔了,所以在天空中醒来见到帆高的那一刻她就开始奔跑了,毫不犹豫跟着帆高一起跳了下去。

其实故事就是这么简单,只不过是插了一些别的元素在里面然后被观众放大了看而已。然后因为存在有这些额外的元素,但并没有处理好,就会被抓着批评了。那干嘛要对新海诚有这么高的期待值呢?如果只是因为《你的名字。》就对这部电影产生了莫大的期待,那还是算了吧,新海诚其实仍然不是完全的商业化,就做观众喜欢看的、没有什么短板的电影这种情况没有在他身上发生,他还是想做自己的东西,他想画天空与云朵,好那干脆把场景主舞台放到天空中、放在云层之上。他想写为了爱拯救世界又算得上是什么,好男主冲破层层阻碍来到天上将女主唤醒并一起跳下,让暴雨尽情释放淹没半个东京。但是前作的成功已经裹挟了他,于是我们看到了那些似曾相识的桥段,在整部电影中多次看MV。但是你仍然能够感受到那种带着淡淡忧伤的小文艺气息,这就是新海诚的风格。

当然电影将很大的篇幅花在了帆高如何脱身来到简易鸟居的过程,途中还顺带塑造了一下桂介和夏美这对叔侄的人物形象,我觉得这段是稍显过长了,尤其是在山手线轨道上跑那段,当然这也可能有他自己的独特用意,这里还是不多加揣摩了。

至少于我而言,在一个半小时的时间里,我看完了一个浪漫到极致的故事,还有非常舒服的视觉和听觉体验,这不就足够了吗,我们为什么还要对着这么一部浪漫文艺片做“阅读理解”呢?这就是新海诚写的一个梦,一个关于浪漫恋爱的梦,你难道没有梦见过自己和喜欢的女孩一起经历一段极其不平凡的冒险吗?