為什麼我要上傳行車記錄給 comma ai?他們收集了什麼?該如何保護我的隱私?
原文於 2022年2月14日 發表
Comma ai 在 2021 年三月時分享了一篇文章,內文提及到他們每周大概可以收集 500000 英里 (約等於 804672 公里) 的行車數據,而 openpilot 之所以能夠持續的進步便是因為有這些用戶們無償的提供行車數據回去給他們做模型的訓練。
今天我們就來聊聊他們到底收集了什麼,我們該如何保護我們的隱私。
為什麼收集?收集了什麼?
首先我相信後期加入的車友們應該不知道,從你發動車子開始直到熄火, openpilot 會收集你所有的行車數據、行車畫面、駕駛畫面 (可關閉)、 GPS 行車軌跡吧?
更準確的說, openpilot 從車上收集了諸如車速、方向盤轉角、油門、剎車等等的訊息外,還從他們的硬體平台收集了高精度 GPS 定位位置、動態 (陀螺儀)、前置相機影像 (朝駕駛)、後置相機影像 (朝前方路面) 等等的訊息。
comma ai 為了能不依賴光達這類的高精度傳感器,便從上面例子裡收集來的訊息配合一系列自行開發的工具 (如 rednose、laika 等),將這一切的資料融合,最終成為精準度相當高的數據集 (有興趣的可以參考他們發佈的comma2k19 數據集)。
也因為能產生這樣高精準度的數據集,comma ai 才有辦法在短短的幾年時間之內做出比車廠還要優越的 ADAS 輔助駕駛系統。
所以,除了從硬體裡面賺取一些費用外,對於 comma ai 來說最大的價值便是利用 openpilot 的用戶所提供的行車數據來產出新的 AI 模型優化控車。
疑慮
然後隨著個資法、GDPR 這類的法規實行,類似 openpilot 這樣子的系統在某些國家 (例如德國) 是不能隨意收集並上傳這些資料的,除了有個資洩漏的疑慮外,可能還會有國安的相關問題出現。(例如在大陸是不能隨便收集 GPS 訊息)
曾經有個在 openpilot 圈內比較知名的事件,Arne Schwarck (Arnepilot 的作者) 便是因為德國相關的條例,被德國警方強制拆下禁止使用 openpilot 平台,最後淡出開發者圈。
當然也有許多對於隱私比較注重的車友們也對此產生疑慮,然 George Hotz 也多次表明了,如果你不願意分享你的數據你可以選擇不使用 openpilot 或是其它的軟體。
保護隱私
如果你對 openpilot 收集的資料有疑慮且不願意提供任何的行車數據,我們該如何保護自已的行蹤不被外流呢?這裡提供幾個方案供參考:
關閉採集駕駛畫面
將這個設定關閉後 openpilot 便會停止收集車內的畫面。(但仍然會收集 GPS、行車畫面的數據)
不要連上網
連上網後 openpilot 便會將採集的數據回傳給 comma ai,除非你有修改程式碼的能力,不然這是強制性的,沒辦法中止,所以最安全的方法便是不要連線。
不要開啟/允許 SSH 連線給他人
openpilot 在關閉其功能下是無法連線至你的硬體平台的,非需要的情況下一律將該功能關閉,這樣其收集的數據便無法經過 SSH 連線外流。
刪除存在平台裡面的記錄
將 /data/media/0/realdata/ 裡所有的檔案刪除。
我們強列的建議用戶們在允許的情況下上傳行車數據,在以低廉的價格享受高品質的系統同時,互助互利,讓大家一起來與 comma ai 訓練 openpilot 這位駕駛的大腦。
外流
我們也注意到有些副廠已經自行將上傳網址修改連線至別的主機,而其使用條款仍延用指回 comma ai 並以它們的名義在收集資料。所以車友們也要針對其使用的版本的源始碼分析,以免數據被某些廠商盜用、外流:
打開 /data/openpilot/common/api/__init__.py 檔案
確保主機指向為:
API_HOST = os.getenv('API_HOST', 'https://api.commadotai.com')
我們盡量以最簡單易懂的方式說明,若有任何錯誤也麻煩各位指正。
未經授權請勿任意轉發,轉發請註明出處,謝謝。




