2023年终总结

renyuneyun 2024年01月07日(周日) 1 mins

由于种种原因,今年博文写得较少,远远没有达到以前平均每月一篇的程度。但实际上今年遇到看到的事情丝毫不比往年少,值得写的内容其实也不少。现在趁着年尾,正好对今年我的观察和我自己的生活等进行一个总结,顺便随意考虑一下明年或许要补的话题。

社会与世界

本博客读者大约多少注意到过,虽然博客主要是技术内容,但也有不少的社会相关内容——虽然未必都是讨论(如如是我闻分类下的那些摘录)。但2023年我却一篇社会话题都没写,全是技术或杂项话题。这不是因为我不关注社会话题了,恰恰相反,反而是因为今年关注下的奇妙观察更多了,以前的一些认识不再适用,所以不太好写了。事实上,我的草稿中有两篇社会相关话题,但我选择的切入点却不是社会,而是思路或者说思维模型。这是因为我发现与其对一件件具体的事进行讨论,不如更进一步去讨论其背后更普适的思维模型。而之所以尝试去写思维模型,则是因为我在多年的观察中终于形成了更确切的思路,而不像以往一样主要是模糊的概念或者说印象。

其中我最满意的一篇叫做《大乘与小乘》,借用佛教的两个术语来讨论一些社会思维现象。有空的话考虑写完最后一小部分然后发出来。

作为一个道标,这里简单罗列一下我回忆起的一些大事件吧:

  • 中国彻底放开新冠疫情管制(去年底开始)
  • 暴雪骚操作退出中国(辣鸡考迪克);微软完成收购暴雪
  • 流浪气球事件上美国的歇斯底里
  • 《流浪地球2》的火热(以及《满江红》的各种奇闻)
  • 马斯克收购Twitter,开除大量(高层)人员,曝光内部隐藏团队和设计,改名X,解禁懂王账号(但懂王没搭腔);许多人开始使用Mastodon等去中心化社交平台
  • ChatGPT、GPT4以及GPTs;今年中外推出多种模型和系统;知名研究者意见分化,特例之一是Geoffrey Hinton退出谷歌然后强调AI风险
  • 瓦格纳武装上访;普里戈任(普里戈金)飞机失事
  • 华为偷袭发布Mate60系列,搭载麒麟9000+,重新(通过未知方法)拥有芯片生产能力和5G芯片
  • 日本正式开始排放福岛核污水,预计排放30年;英国核设施泄漏,问题掩盖多年
  • 以色列从报复哈马斯袭击到疯魔袭击加沙地带;联合国安理会决议因为反复被一票否决而难产;欧美高校相关表态和事件
  • 新闻越来越少的俄乌
  • 贯穿全年的美国越来越极(jing)端(cai)的党争
  • 全球继续右翼回潮;阿根廷大选米莱胜出,纲领多少有点疯疯癫癫,被称为极右翼但又类似无政府主义

技术话题

ChatGPT等生成式AI应用

ChatGPT无疑是今年最重要的技术和社会话题,而且OpenAI也相当会营销,使得它的话题始终不减,且拥趸甚多。

虽然更早的如Stable Diffusion的图像生成式AI早就开始对此有一定“预告”了,但自然语言无疑是让普罗大众感知最为明确的东西,所以作为NLP成果的ChatGPT自然获得了远超其他技术的讨论度。

我其实也没能免俗,在年初的时候写了相关的文章,还胆敢去分了上下两篇,一篇写NLP技术,一篇写后续推演。写它们的主要原因是当时的讨论几乎全部围绕在通用人工智能和诸如「意识」的概念上,可以说全部都是人文和哲学讨论,反而几乎没有人去了解其技术本质。正所谓「物有本末,事有终始;知其先后,则近道矣」,在有根源的东西上不去从根源进行讨论,无论如何也都只是扯淡而已。我当时就是抱着这样的心态去列的提纲,但写着写着发现原定的上篇很难在有限的长度中写完,而下篇又需要上篇的知识作为铺垫,所以最终还是搁置了。

站在年尾,回头看看,本年的讨论从初期的哲学讨论慢慢过渡到更多还是技术讨论,也算是符合了社会对新技术或理念的一贯讨论和接受风格。虽然似乎非技术人士的认知大体还是觉得它很「神奇」(所以有过高猜想,比如「意识」),但人们大抵也都接受了这是个工具且(只要有足够的资源)谁都可以重新再造一个的观念。年尾谷歌展示Gemini的时候搞的小花招以及后续的所谓「Gemini套壳文心一言」(这话是错的,但这里强调该讨论的存在本身所反映的思维变迁)也大抵证明了目前的LLM仍有很明确的上限。

但无论现在的LLM有或没有上限都好,我至少当年学过相关课程,对此都有所预计。其实我更在乎的是另外的关于其技术方面的影响的话题,以及对社会的影响的话题,而不仅限于浅薄的「是否会取代一部分人工」这种每次技术变革都会进行一次的循环的讨论。

一者,我们需要讨论这类技术使用中和使用后对人们的影响,包括但不限于对其回答的盲目相信(后来关于所谓「幻觉」的讨论已经让人们逐步意识到了),盲目悲观情绪,对人的工具化的讨论(取代部分人),人过分依赖AI结论可能导致的智能退化,训练数据导致的偏见和强化,以及所谓的Prompt工程的可持续性的讨论。当然,对最有希望的智能助理的期待和问题(尤其是false positive/假阳性问题)也有必要进行讨论。

二者,我们更应该讨论长期和其技术背后的那些问题。相关话题主要包括开发AI的目的是增强人类还是模仿或取代人类(不是社会学讨论,而是技术路线讨论;也不是逻辑或ML的问题),关于日后的「科学」的讨论,训练数据从哪来又怎么维持,AI工具应用后可能对人们思维的影响(工具影响思维),还有算力和资源的消耗问题。这些多多少少还涉及到所谓「智能是什么」这样的哲学问题,但我大约也讨论不出来什么结论——虽然我可以排除一些错误选项,但也不会比其他人讨论的深入。

这些其实是我原本写的《下篇》的内容,但却一直没能写完。这大半年下来,我也没有看到多少这方面的讨论。2024年如果有空,我会考虑将其写完。如果中间看到他人的比较不错的讨论,至少我也可以整理一下别人的成果,做个索引。

SoLiD和去中心化

由于EWADA项目,这一年更深入涉及SoLiD和去中心化的技术话题(另见《论Web3.0和Web3》)。

在我本人工作和兴趣之外,Twitter的变迁也导致今年对去中心化社交网络的讨论迎来了一个小高潮(报道ref1)。我对这种讨论自是喜闻乐见的,但站在年尾看,相关影响似乎仍然有限,或许还不如Twitter限制浏览推文数的讨论多(报道ref2)。

在我看来,使用去中心化的社交平台是理所当然的选项,这可以从根源上解决这些问题,且不引入额外的问题。接下来的方向一是扩展技术边界,让去中心化系统可以合适地支持更多的功能(并且,开发更多相关软件!),二是探索如何刺激/激励人们开始使用这些系统。以我的经验来看,似乎最好的方案是开发一个杀手级应用,让人们先上车,然后再解释,而不是从哲学上进行讨论。这似乎也符合许多历史经验。

此外,去中心化的同时也要保证各个应用程序之间的互操作性,否则这种去中心化的意义就很有限了——有点类似Android试图模仿iOS做隔离又试图支持跨App调用最后该机制几乎没被正经使用的现状(这也是我开发Easer时发现的一大窘境)。这是我看好SoLiD的一大原因,毕竟它是我所看到的唯一一个将互操作性作为主要话题之一进行讨论的去中心化系统。当然,SoLiD有其自己的问题,但我至少看到活跃的社区和研究,所以对此抱有较大希望。

当然,它是Tim Berners-Lee提出这点也是一大原因就是了。

互联互通

今年的另一大话题是(跨域的)互联互通。前些年鸿蒙算是开了个头,但主流讨论一直陷于套壳的争议中。在我看来,这种争议其实没什么意义,毕竟整个操作系统是分层分块的,不能说只有全部都是自己开发的才叫创新,但这却是那些讨论中的主要论点。

当然,我也不觉得小规模的创新有必要叫做新的操作系统。一个例子就是我当年对UOS的评价:桌面环境是deepin的,下层也都是要么沿用deepin要么是社区通用的软件;值得说道的是努力支持龙芯CPU,但那本质上是对Linux内核的补丁,不足以称为新的操作系统。我支持他们的努力,但对那些媒体通告很不屑。

在我看来,鸿蒙作为操作系统和Linux或其他系统区别开的主要特点就是它的所谓分布式软总线,以及各种(都支持该技术的)内核和发行版,以适用于不同能力的硬件。当然了,我并非鸿蒙开发人员,并不知道他们究竟做到几分,以及能做到什么程度。但从这些年的发展来看,似乎内核是真的,这个分布式软总线也的确至少能做到RPC,以及一定程度的硬件共享。我不好评价它究竟性能和硬件共享究竟做到什么地步,不过达到了宣称目标的70%大约还是有的。(本部分假设这是真的。)

当然,我还记得最初华为宣称自研的鸿蒙分布式操作系统内核既使用微内核架构,又具有极低的延迟。这事看起来总觉得不靠谱,毕竟我理解中这两者不可兼得。不知道是我理解有问题,还是华为有所突破,还是其他什么。

今年华为大出风头,顺便宣布了鸿蒙的未来目标——鸿蒙Next——要全部使用原生应用而移除Android支持。从长期体验来看,这其实是个好事,毕竟Android的设计更像iOS,在互联互通这件事上做得很有限,自然鸿蒙上运行的Android App也就只能使用Android API而已,无法使用那些互联互通的功能,也就是所谓的分布式软总线。但同时放弃Android支持就意味着许多已有App无法使用,那么吸引开发者进入生态就成了问题。

在华为之外,其他厂商也在做自己的「系统」,以达成类似的效果,比如小米就宣布MIUI 14以后改用HyperOS。说起来,小米最近两年已经在MIUI中做了不少系统侧互联互通功能(远程控制、剪贴板共享、远程播放音频之类)。但从发布会和相关讨论看,我并不清楚他们究竟只是将一些简单的远程调用集成在Android系统中,还是像鸿蒙一样做了一个抽象层。小米似乎没有提过直接使用远程硬件计算,而鸿蒙则是从一开始就强调这点。这两者的区别在开放给应用时将会显著放大,所以我觉得小米的HyperOS未来怎么发展值得观察。毕竟如果只是一些调用的话,Windows上有不少相关软件可以做这些(如Intel Unison),Linux上也有不少开源软件(如scrcpy和KDEConnect等),虽然集成度不高就是了。

其他厂商也有一些类似的举动,但格局似乎都更小一点,主要是和车机进行结合,提供一些便捷使用的功能。但至少都迈出了互联互通的这一步。

但正如前一节对去中心化系统的评论一样,如果各家仍旧只是建立各自的封闭花园,而没有互操作性,那么这种互联互通效果仍旧十分有限。我理解在初期出于商业考虑只开发自己的东西,但期待在不太久远的未来他们可以统一或互相兼容。举个简单的例子:既然鸿蒙已经开源,分布式软总线的代码应当也在其中,那么何不稍微分出一点精力,提供一个Linux版的分布式软总线集成,贡(至少是中文的)Linux社区试用呢?我相信社区会自发传福音的。

JS和Web开发

由于更多涉及了SoLiD,我在去年年底也去学了些JS/TS和Web开发,并且今年用得更多了。

总的来说,我觉得TS的类型系统还是挺有意思的,有一些(不得不进行的)创新;Web开发框架(主要是Vue,但也用了点React)也挺有意思,有些理念我挺喜欢,希望所有的UI框架都能支持。但Web开发的生态实在是一团乱麻,我虽然对各个框架/工具之间的关系有所认识,但仍然栽了很多很多跟头,浪费了大量的时间。如果这些时间用在了解新理念上倒也罢了,但最终发现它们都只是浪费,浪费在理解工具的设计细节上,而非通用理念上。

虽然我对Go和Rust(尤其是Go)拥有大包大揽的官方管理工具不够喜欢,但我真心希望Web端可以出现一个类似的单一工具,统一一下设计,不要再让开发者浪费生命了。即使不能做到那样,至少类似Python一样有官方推荐标准也好。

多样性不应该等于杂乱。这是我今年的一大心得。

Mac和MacOS

去年下半年拿到了工作用的Mac,所以今年也有更多的MacOS使用机会。我去年初用时写了一篇《Linux用户的Mac初体验(及吐槽)》,而现在则是有了更多认识。

总体而言,我还是觉得MacOS在系统设计上做得不好。我虽然出于个人口味不够喜欢它的UI风格,但也承认风格还不错,至少很统一。但它的桌面环境在许多细节上设计很成问题:说它没考虑自定义性吧,它支持许多系统扩展;说它考虑了用户多样性吧,在许多本该理所当然可以调整的东西上又不能自定义。这里举几个例子展示这种奇怪的感觉。

第一 ,我希望能够调整显示内容的缩放比例,将其放大一些,这算是支持(虽然似乎是调整分辨率)。但同时, 我希望系统顶栏上图标不要同步放大,因为这加上刘海会导致托盘图标只能显示少数的几个。然而这个功能不存在。最后我只能做了个妥协,选择使用了一个系统插件,将托盘收起来,默认只显示最主要的几个图标(对的,这需要装个第三方插件,而不是一个有十GB大的系统自带的)。

第二,我希望调整系统通知和各种事件音效。但这个功能不存在,似乎唯一的方案是覆盖对应的系统音频文件。

第三,MBP的音效类似「音乐厅」之类的效果,我不喜欢,想改成平淡不加修饰的。但这个功能也不存在。

第四,我希望将Dock中的Finder图标移动到后边,和其他应用程序放在一起,将启动器图标放在最前面。但Finder图标是固定在Dock上的,无法调整。类似的还有系统顶栏托盘最边缘的一些图标,比如切换通知侧栏。稍微想了一下,我觉得Finder之于MacOS可能类似Explorer之于Windows——它是系统的底层,同时提供了桌面环境的主体和文件管理器两项功能;而通知侧栏则应当是依赖那个托盘图标保持存活,所以不能移除图标,否则侧栏就会失效。

第五,我需要时常打开终端,包括需要保持许多终端窗口,以及打开新的终端窗口。然而我找了很久,也没有找到能够「打开新终端应用程序实例」的快捷键——所有的快捷键都等价于点击Dock上固定的终端应用程序图标,也就是切换到当前实例或(假如没有当前实例时)开启新实例。另外,绝大多数第三方终端软件们似乎都不支持开启新标签页这个简单的功能,反而指示用户去使用系统提供的合并同应用程序窗口为标签的功能。然而这个功能是全局的,只有三个选项:开启、关闭和对全屏窗口开启。对于我来说,这就是个废功能,毕竟我只希望终端使用标签页,而不是任何软件都合并成标签页。

总之,由于这些细节上的诡异设计,我觉得MacOS的开发团队其实并没有一个有效的用户反馈渠道。说它金玉其外败絮其中有点过分,但说它表里如一则完全是假话了。

个人

最后简单回顾一下自己的这一年吧。

大体来说,这一年主要就是继续推进在EWADA项目中的博士后研究。今年花费了大量精力在Libertas上,希望可以有个好的结果;也将DToU(Data Terms of Use)更进一步推进。由于所在课题组的特点(Human-Centred AI),我也在将我的主方向(Data Terms of Use)向着更加Human-Centred的相关内容进行联系。希望2024年可以继续推进。

在自己课题之余,我也更多参与了SoLiD和语义网的相关讨论。这也促成了我今年写两篇相关博文(《论Web3.0和Web3》和《语义网和关联数据(浅层)知识梳理》)的契机。总的来说,我很喜欢相关技术,但感觉需要一定改变。有空的话我会尝试梳理一下相关思绪。

但不管怎么说,明年应当会继续推进SoLiD的话题,并且继续应用语义网的技术。同时我也会进一步尝试将LLM或NLP技术用在其中,毕竟自动化和个人助理始终是个好东西,Tim Berners-Lee也对SoLiD+LLM的个人助理进行了展望

最后给自己打个广告吧:W3C中国会在1月11日举行一个SoLiD相关的线上讨论会,我会在其中做个题为《On the Social aspect of SoLiD 探索SoLiD的社交与社会技术属性》的小报告,梳理一下我们团队在SoLiD上的经验和展望。欢迎更多人参与到SoLiD相关讨论。

Forward links:

您可以在Hypothesis上的該群組內進行評論,或使用下面的Disqus評論。