2023年終總結

renyuneyun 2024年01月07日(週日) 1 mins

由於種種原因,今年博文寫得較少,遠遠沒有達到以前平均每月一篇的程度。但實際上今年遇到看到的事情絲毫不比往年少,值得寫的內容其實也不少。現在趁着年尾,正好對今年我的觀察和我自己的生活等進行一個總結,順便隨意考慮一下明年或許要補的話題。

社會與世界

本博客讀者大約多少注意到過,雖然博客主要是技術內容,但也有不少的社會相關內容——雖然未必都是討論(如如是我聞分類下的那些摘錄)。但2023年我卻一篇社會話題都沒寫,全是技術或雜項話題。這不是因爲我不關注社會話題了,恰恰相反,反而是因爲今年關注下的奇妙觀察更多了,以前的一些認識不再適用,所以不太好寫了。事實上,我的草稿中有兩篇社會相關話題,但我選擇的切入點卻不是社會,而是思路或者說思維模型。這是因爲我發現與其對一件件具體的事進行討論,不如更進一步去討論其背後更普適的思維模型。而之所以嘗試去寫思維模型,則是因爲我在多年的觀察中終於形成了更確切的思路,而不像以往一樣主要是模糊的概念或者說印象。

其中我最滿意的一篇叫做《大乘與小乘》,借用佛教的兩個術語來討論一些社會思維現象。有空的話考慮寫完最後一小部分然後發出來。

作爲一個道標,這裏簡單羅列一下我回憶起的一些大事件吧:

  • 中國徹底放開新冠疫情管制(去年底開始)
  • 暴雪騷操作退出中國(辣雞考迪克);微軟完成收購暴雪
  • 流浪氣球事件上美國的歇斯底里
  • 《流浪地球2》的火熱(以及《滿江紅》的各種奇聞)
  • 馬斯克收購Twitter,開除大量(高層)人員,曝光內部隱藏團隊和設計,改名X,解禁懂王賬號(但懂王沒搭腔);許多人開始使用Mastodon等去中心化社交平臺
  • ChatGPT、GPT4以及GPTs;今年中外推出多種模型和系統;知名研究者意見分化,特例之一是Geoffrey Hinton退出谷歌然後強調AI風險
  • 瓦格納武裝上訪;普里戈任(普里戈金)飛機失事
  • 華爲偷襲發佈Mate60系列,搭載麒麟9000+,重新(通過未知方法)擁有芯片生產能力和5G芯片
  • 日本正式開始排放福島核污水,預計排放30年;英國核設施泄漏,問題掩蓋多年
  • 以色列從報復哈馬斯襲擊到瘋魔襲擊加沙地帶;聯合國安理會決議因爲反覆被一票否決而難產;歐美高校相關表態和事件
  • 新聞越來越少的俄烏
  • 貫穿全年的美國越來越極(jing)端(cai)的黨爭
  • 全球繼續右翼回潮;阿根廷大選米萊勝出,綱領多少有點瘋瘋癲癲,被稱爲極右翼但又類似無政府主義

技術話題

ChatGPT等生成式AI應用

ChatGPT無疑是今年最重要的技術和社會話題,而且OpenAI也相當會營銷,使得它的話題始終不減,且擁躉甚多。

雖然更早的如Stable Diffusion的圖像生成式AI早就開始對此有一定“預告”了,但自然語言無疑是讓普羅大衆感知最爲明確的東西,所以作爲NLP成果的ChatGPT自然獲得了遠超其他技術的討論度。

我其實也沒能免俗,在年初的時候寫了相關的文章,還膽敢去分了上下兩篇,一篇寫NLP技術,一篇寫後續推演。寫它們的主要原因是當時的討論幾乎全部圍繞在通用人工智能和諸如「意識」的概念上,可以說全部都是人文和哲學討論,反而幾乎沒有人去瞭解其技術本質。正所謂「物有本末,事有終始;知其先後,則近道矣」,在有根源的東西上不去從根源進行討論,無論如何也都只是扯淡而已。我當時就是抱着這樣的心態去列的提綱,但寫着寫着發現原定的上篇很難在有限的長度中寫完,而下篇又需要上篇的知識作爲鋪墊,所以最終還是擱置了。

站在年尾,回頭看看,本年的討論從初期的哲學討論慢慢過渡到更多還是技術討論,也算是符合了社會對新技術或理念的一貫討論和接受風格。雖然似乎非技術人士的認知大體還是覺得它很「神奇」(所以有過高猜想,比如「意識」),但人們大抵也都接受了這是個工具且(只要有足夠的資源)誰都可以重新再造一個的觀念。年尾谷歌展示Gemini的時候搞的小花招以及後續的所謂「Gemini套殼文心一言」(這話是錯的,但這裏強調該討論的存在本身所反映的思維變遷)也大抵證明了目前的LLM仍有很明確的上限。

但無論現在的LLM有或沒有上限都好,我至少當年學過相關課程,對此都有所預計。其實我更在乎的是另外的關於其技術方面的影響的話題,以及對社會的影響的話題,而不僅限於淺薄的「是否會取代一部分人工」這種每次技術變革都會進行一次的循環的討論。

一者,我們需要討論這類技術使用中和使用後對人們的影響,包括但不限於對其回答的盲目相信(後來關於所謂「幻覺」的討論已經讓人們逐步意識到了),盲目悲觀情緒,對人的工具化的討論(取代部分人),人過分依賴AI結論可能導致的智能退化,訓練數據導致的偏見和強化,以及所謂的Prompt工程的可持續性的討論。當然,對最有希望的智能助理的期待和問題(尤其是false positive/假陽性問題)也有必要進行討論。

二者,我們更應該討論長期和其技術背後的那些問題。相關話題主要包括開發AI的目的是增強人類還是模仿或取代人類(不是社會學討論,而是技術路線討論;也不是邏輯或ML的問題),關於日後的「科學」的討論,訓練數據從哪來又怎麼維持,AI工具應用後可能對人們思維的影響(工具影響思維),還有算力和資源的消耗問題。這些多多少少還涉及到所謂「智能是什麼」這樣的哲學問題,但我大約也討論不出來什麼結論——雖然我可以排除一些錯誤選項,但也不會比其他人討論的深入。

這些其實是我原本寫的《下篇》的內容,但卻一直沒能寫完。這大半年下來,我也沒有看到多少這方面的討論。2024年如果有空,我會考慮將其寫完。如果中間看到他人的比較不錯的討論,至少我也可以整理一下別人的成果,做個索引。

SoLiD和去中心化

由於EWADA項目,這一年更深入涉及SoLiD和去中心化的技術話題(另見《論Web3.0和Web3》)。

在我本人工作和興趣之外,Twitter的變遷也導致今年對去中心化社交網絡的討論迎來了一個小高潮(報道ref1)。我對這種討論自是喜聞樂見的,但站在年尾看,相關影響似乎仍然有限,或許還不如Twitter限制瀏覽推文數的討論多(報道ref2)。

在我看來,使用去中心化的社交平臺是理所當然的選項,這可以從根源上解決這些問題,且不引入額外的問題。接下來的方向一是擴展技術邊界,讓去中心化系統可以合適地支持更多的功能(並且,開發更多相關軟件!),二是探索如何刺激/激勵人們開始使用這些系統。以我的經驗來看,似乎最好的方案是開發一個殺手級應用,讓人們先上車,然後再解釋,而不是從哲學上進行討論。這似乎也符合許多歷史經驗。

此外,去中心化的同時也要保證各個應用程序之間的互操作性,否則這種去中心化的意義就很有限了——有點類似Android試圖模仿iOS做隔離又試圖支持跨App調用最後該機制幾乎沒被正經使用的現狀(這也是我開發Easer時發現的一大窘境)。這是我看好SoLiD的一大原因,畢竟它是我所看到的唯一一個將互操作性作爲主要話題之一進行討論的去中心化系統。當然,SoLiD有其自己的問題,但我至少看到活躍的社區和研究,所以對此抱有較大希望。

當然,它是Tim Berners-Lee提出這點也是一大原因就是了。

互聯互通

今年的另一大話題是(跨域的)互聯互通。前些年鴻蒙算是開了個頭,但主流討論一直陷於套殼的爭議中。在我看來,這種爭議其實沒什麼意義,畢竟整個操作系統是分層分塊的,不能說只有全部都是自己開發的纔叫創新,但這卻是那些討論中的主要論點。

當然,我也不覺得小規模的創新有必要叫做新的操作系統。一個例子就是我當年對UOS的評價:桌面環境是deepin的,下層也都是要麼沿用deepin要麼是社區通用的軟件;值得說道的是努力支持龍芯CPU,但那本質上是對Linux內核的補丁,不足以稱爲新的操作系統。我支持他們的努力,但對那些媒體通告很不屑。

在我看來,鴻蒙作爲操作系統和Linux或其他系統區別開的主要特點就是它的所謂分佈式軟總線,以及各種(都支持該技術的)內核和發行版,以適用於不同能力的硬件。當然了,我並非鴻蒙開發人員,並不知道他們究竟做到幾分,以及能做到什麼程度。但從這些年的發展來看,似乎內核是真的,這個分佈式軟總線也的確至少能做到RPC,以及一定程度的硬件共享。我不好評價它究竟性能和硬件共享究竟做到什麼地步,不過達到了宣稱目標的70%大約還是有的。(本部分假設這是真的。)

當然,我還記得最初華爲宣稱自研的鴻蒙分佈式操作系統內核既使用微內核架構,又具有極低的延遲。這事看起來總覺得不靠譜,畢竟我理解中這兩者不可兼得。不知道是我理解有問題,還是華爲有所突破,還是其他什麼。

今年華爲大出風頭,順便宣佈了鴻蒙的未來目標——鴻蒙Next——要全部使用原生應用而移除Android支持。從長期體驗來看,這其實是個好事,畢竟Android的設計更像iOS,在互聯互通這件事上做得很有限,自然鴻蒙上運行的Android App也就只能使用Android API而已,無法使用那些互聯互通的功能,也就是所謂的分佈式軟總線。但同時放棄Android支持就意味着許多已有App無法使用,那麼吸引開發者進入生態就成了問題。

在華爲之外,其他廠商也在做自己的「系統」,以達成類似的效果,比如小米就宣佈MIUI 14以後改用HyperOS。說起來,小米最近兩年已經在MIUI中做了不少系統側互聯互通功能(遠程控制、剪貼板共享、遠程播放音頻之類)。但從發佈會和相關討論看,我並不清楚他們究竟只是將一些簡單的遠程調用集成在Android系統中,還是像鴻蒙一樣做了一個抽象層。小米似乎沒有提過直接使用遠程硬件計算,而鴻蒙則是從一開始就強調這點。這兩者的區別在開放給應用時將會顯著放大,所以我覺得小米的HyperOS未來怎麼發展值得觀察。畢竟如果只是一些調用的話,Windows上有不少相關軟件可以做這些(如Intel Unison),Linux上也有不少開源軟件(如scrcpy和KDEConnect等),雖然集成度不高就是了。

其他廠商也有一些類似的舉動,但格局似乎都更小一點,主要是和車機進行結合,提供一些便捷使用的功能。但至少都邁出了互聯互通的這一步。

但正如前一節對去中心化系統的評論一樣,如果各家仍舊只是建立各自的封閉花園,而沒有互操作性,那麼這種互聯互通效果仍舊十分有限。我理解在初期出於商業考慮只開發自己的東西,但期待在不太久遠的未來他們可以統一或互相兼容。舉個簡單的例子:既然鴻蒙已經開源,分佈式軟總線的代碼應當也在其中,那麼何不稍微分出一點精力,提供一個Linux版的分佈式軟總線集成,貢(至少是中文的)Linux社區試用呢?我相信社區會自發傳福音的。

JS和Web開發

由於更多涉及了SoLiD,我在去年年底也去學了些JS/TS和Web開發,並且今年用得更多了。

總的來說,我覺得TS的類型系統還是挺有意思的,有一些(不得不進行的)創新;Web開發框架(主要是Vue,但也用了點React)也挺有意思,有些理念我挺喜歡,希望所有的UI框架都能支持。但Web開發的生態實在是一團亂麻,我雖然對各個框架/工具之間的關係有所認識,但仍然栽了很多很多跟頭,浪費了大量的時間。如果這些時間用在瞭解新理念上倒也罷了,但最終發現它們都只是浪費,浪費在理解工具的設計細節上,而非通用理念上。

雖然我對Go和Rust(尤其是Go)擁有大包大攬的官方管理工具不夠喜歡,但我真心希望Web端可以出現一個類似的單一工具,統一一下設計,不要再讓開發者浪費生命了。即使不能做到那樣,至少類似Python一樣有官方推薦標準也好。

多樣性不應該等於雜亂。這是我今年的一大心得。

Mac和MacOS

去年下半年拿到了工作用的Mac,所以今年也有更多的MacOS使用機會。我去年初用時寫了一篇《Linux用戶的Mac初體驗(及吐槽)》,而現在則是有了更多認識。

總體而言,我還是覺得MacOS在系統設計上做得不好。我雖然出於個人口味不夠喜歡它的UI風格,但也承認風格還不錯,至少很統一。但它的桌面環境在許多細節上設計很成問題:說它沒考慮自定義性吧,它支持許多系統擴展;說它考慮了用戶多樣性吧,在許多本該理所當然可以調整的東西上又不能自定義。這裏舉幾個例子展示這種奇怪的感覺。

第一 ,我希望能夠調整顯示內容的縮放比例,將其放大一些,這算是支持(雖然似乎是調整分辨率)。但同時, 我希望系統頂欄上圖標不要同步放大,因爲這加上劉海會導致托盤圖標只能顯示少數的幾個。然而這個功能不存在。最後我只能做了個妥協,選擇使用了一個系統插件,將托盤收起來,默認只顯示最主要的幾個圖標(對的,這需要裝個第三方插件,而不是一個有十GB大的系統自帶的)。

第二,我希望調整系統通知和各種事件音效。但這個功能不存在,似乎唯一的方案是覆蓋對應的系統音頻文件。

第三,MBP的音效類似「音樂廳」之類的效果,我不喜歡,想改成平淡不加修飾的。但這個功能也不存在。

第四,我希望將Dock中的Finder圖標移動到後邊,和其他應用程序放在一起,將啓動器圖標放在最前面。但Finder圖標是固定在Dock上的,無法調整。類似的還有系統頂欄托盤最邊緣的一些圖標,比如切換通知側欄。稍微想了一下,我覺得Finder之於MacOS可能類似Explorer之於Windows——它是系統的底層,同時提供了桌面環境的主體和文件管理器兩項功能;而通知側欄則應當是依賴那個托盤圖標保持存活,所以不能移除圖標,否則側欄就會失效。

第五,我需要時常打開終端,包括需要保持許多終端窗口,以及打開新的終端窗口。然而我找了很久,也沒有找到能夠「打開新終端應用程序實例」的快捷鍵——所有的快捷鍵都等價於點擊Dock上固定的終端應用程序圖標,也就是切換到當前實例或(假如沒有當前實例時)開啓新實例。另外,絕大多數第三方終端軟件們似乎都不支持開啓新標籤頁這個簡單的功能,反而指示用戶去使用系統提供的合併同應用程序窗口爲標籤的功能。然而這個功能是全局的,只有三個選項:開啓、關閉和對全屏窗口開啓。對於我來說,這就是個廢功能,畢竟我只希望終端使用標籤頁,而不是任何軟件都合併成標籤頁。

總之,由於這些細節上的詭異設計,我覺得MacOS的開發團隊其實並沒有一個有效的用戶反饋渠道。說它金玉其外敗絮其中有點過分,但說它表裏如一則完全是假話了。

個人

最後簡單回顧一下自己的這一年吧。

大體來說,這一年主要就是繼續推進在EWADA項目中的博士後研究。今年花費了大量精力在Libertas上,希望可以有個好的結果;也將DToU(Data Terms of Use)更進一步推進。由於所在課題組的特點(Human-Centred AI),我也在將我的主方向(Data Terms of Use)向着更加Human-Centred的相關內容進行聯繫。希望2024年可以繼續推進。

在自己課題之餘,我也更多參與了SoLiD和語義網的相關討論。這也促成了我今年寫兩篇相關博文(《論Web3.0和Web3》和《語義網和關聯數據(淺層)知識梳理》)的契機。總的來說,我很喜歡相關技術,但感覺需要一定改變。有空的話我會嘗試梳理一下相關思緒。

但不管怎麼說,明年應當會繼續推進SoLiD的話題,並且繼續應用語義網的技術。同時我也會進一步嘗試將LLM或NLP技術用在其中,畢竟自動化和個人助理始終是個好東西,Tim Berners-Lee也對SoLiD+LLM的個人助理進行了展望

最後給自己打個廣告吧:W3C中國會在1月11日舉行一個SoLiD相關的線上討論會,我會在其中做個題爲《On the Social aspect of SoLiD 探索SoLiD的社交与社会技术属性》的小報告,梳理一下我們團隊在SoLiD上的經驗和展望。歡迎更多人參與到SoLiD相關討論。


您可以在Hypothesis上的該群組內進行評論,或使用下面的Disqus評論。