How to Jam your Data
我想要講一場在 SITCON 2026 的議程,關於要提醒大家有非常多的方法可以記錄自己的每天發生了什麼事情的足跡,並且鼓勵大家勤加紀錄並且有意識的搜集這些資料。隨便先打一些,等期中結束後再來潤一波
大家想到最常見且搞剛的方式是寫日記,反芻自己一整天下來做過的事情。你可以紀錄經過你的想法潤飾過後覺得最重要的東西,但我認為並不是所有東西都是你在當下能夠感受到並且好好記錄下來的事情。但其實搜集各種 metadata 也不失為一種很有趣且有效的方式。比起這些想法輸出以外,你也可以選擇無腦的紀錄最原始的資料,等到未來能夠好好的利用它們。
單純就現在馬上就可以使用的服務來舉例。就作品吸收來說,有 Backloggd 紀錄遊戲、有 Trakt 紀錄影集電影、有 Kitsu 紀錄漫畫動畫、有 Goodreads 紀錄書籍文章、Stats.fm 來同步音樂串流紀錄;就身體活動上,世界迷霧或 Google Maps 有自己的位置時間軸、各種智慧手錶、手環、戒指可以接收你的身體訊號並加以分析儲存;就電腦使用上,現在 GitHub 有如 Dayflow 或 ActivityWatch 的專案在裝置上紀錄螢幕畫面或滑鼠注意的地方再加以解析;就網路平台上,Youtube 瀏覽記錄可以下載、Facebook 或 Meta 的所有活動記錄也可以下載、LINE、Telegram 群組紀錄可以下載;就算不在網路上,隨身帶一隻錄音筆,讓你可以任何時候錄音並且記錄下你講出來或是你聽到的事情(在台灣只要錄音筆不離身,你是可以在不告知其他人的情況下錄音自用的)。更激進的可以是隨身帶著錄影機,紀錄你的一舉一動。
未來透過這些非常個人隱私的資料是可以用來做非常多的研究和資料的呈現和利用方式,以上提到的平台只是現行不同用途的紀錄平台會做的事情而已。有兩個方向:一個是儀表板,將自己現在做的所有事情,用幾乎 Real-time 的介面顯示。最常見的是 Discord status,或是幾乎各種社群平台的初衷——讓你自己在做的事放在 Timeline 讓大家交流;二是產出報告,把這些跨時間、跨平台的資料全部放在一起,想盡辦法歸納出使用者的特性、習慣,以及可以改進或注意的地方。最簡潔暴力的做法是像 GitHub 各種小卡片放在一起,但一個可以自架的 LLM 也可以進一步加值這些資料,變成更容易發現特性的方式。
You are what you eat. You are what you see. 注意力是現代社會我們最珍貴的資產,在乎自己的注意力花在哪裡並且有知覺是很重要的事情。你看的、聽的、感受到的所有東西都會是成為你的一部分,而把這些資料搜集起來,甚至有個助理能夠在不打擾你的隱私的情況下輔助你是很有用的事情。前提是,你要主動去搜集這些資料,只有你有可能會在乎這些事情。各種平台都會嘗試搜集你的數位足跡,你當然可以選擇去下載他們(因為有歐盟等壓力在),但他們的終極目的仍然是讓你能夠成為平台的商品賣給廣告商以及金流等等,不能也不應該成為搜集個人足跡的唯一管道。
我要呼籲以及推坑大家持續在這個坑內 whatever it called(可以嘗試取個名)活躍,無論是身為開發者開發出更好用的 Self-logging App、身為使用者開始著手紀錄,在意這類型資料的隱私和存取權,或是身為推廣者像我一樣希望大家能夠更在意自己的足跡的去向。
SITCON 學生計算機年會是學生自己辦給自己的資訊研討會,明年是 2026/03/28 在中央研究院人文社會科學館。徵稿才剛開始,歡迎去投稿!