LakeFS Mount:徹底改變資料科學家和機器學習從業者的資料訪問

我們很高興地宣布推出lakeFS Mount,這是一款功能強大的新lakeFS客戶端,旨在簡化您的資料工作流程。

LakeFS Mount 讓您可以將 LakeFS 儲存庫(或儲存庫中的路徑)作為本機目錄安裝在任何工作站或伺服器上,為您的資料操作 帶來前所未有的輕鬆和高效。

但安裝到底是什麼意思呢?

掛載檔案系統是指使儲存在遠端位置(如物件儲存)的資料看起來就像是本機檔案系統的一部分,從而無需安裝和配置 SDK 以及編寫自訂資料載入程式碼即可實現無縫存取。

掛載lakeFS儲存庫

LakeFS Mount 適合誰?
LakeFS Mount是為資料科學家和機器學習從業者量身定制的。無論您是製作模型原型、運行複雜的實驗還是從頭開始訓練大型模型,lakeFS Mount 都能讓您的生活變得更輕鬆。讓我們更詳細地了解 3 個常見好處。

透過無縫整合簡化工作流程

LakeFS Mount 的突出功能之一是它能夠與您現有的程式碼和工作流程順利整合。無需進行大量修改或重寫。透過簡單地安裝lakeFS儲存庫,任何可以 新加坡 WhatsApp 號碼數據 讀寫檔案的現有程式碼現在都可以存取lakeFS。這意味著您可以繼續使用您最喜歡的工具和函式庫,而不會受到任何干擾。

在實踐中,這意味著大多數機

器學習專案可以從構思和早期實驗(在本地目錄中使用小型資料集)一直到生產(需要大型分散式存儲,所有這些都使用完全相同的程式碼。

WhatsApp數據

當事情從開發轉向生產時

這減少了「它在我的機器上運行」類型的 線玩視頻遊戲時進行直播來賺 驚喜。在這種情況下,程式碼必須更改以使用更複雜的儲存形式 – 更不用說所使用的庫根本不支援所需的物件儲存介面(或效能較差)的情況。

性能針對高要求的數據科

學家進行了最佳化
雖然 LakeFS Mount 非常容易使用,但它不會影響效能。它採用高級 I/O 模式,例如:

元資料預取:利用lakeFS的高效 人工智慧數據 元資料儲存來避免昂貴的伺服器往返來列出和聲明文件
內容可尋址檔案快取:根據其 LakeFS 身分有效快取數據,以允許快速隨機訪問

延遲獲取:僅在實際需要

時獲取數據,優化速度和資源使用
這些優化確保 LakeFS Mount 可以處理最苛刻的工作負載,防止昂貴的 GPU 在訓練運行期間因物件儲存存取時間而成為瓶頸。詳細了解LakeFS Mount 如何針對高效能和深度學習工作負載進行最佳化。

加速開發和生產工作流程

借助 LakeFS Mount,與外部資料來源整合的負擔已成為過去。這使您可以專注於您最擅長的事情:建立和部署創新的機器學習模型。在生產中,lakeFS Mount 的效能最佳化可確保您的模型高效運行,從而充分利用您的硬體投資。

返回頂端