欧美亚洲中文,在线国自产视频,欧洲一区在线观看视频,亚洲综合中文字幕在线观看

<dfn id="rfwes"></dfn>

<object id="rfwes"></object>

<sup id="d8iik"><thead id="d8iik"><input id="d8iik"></input></thead></sup>

當(dāng)前位置：站長資訊網(wǎng) > 編程知識 > 正文

淺析Nodejs怎么進(jìn)行大文件讀寫

2022-09-29 分類：編程知識閱讀(961) 評論(0)

淺析Nodejs怎么進(jìn)行大文件讀寫

node.js極速入門課程：進(jìn)入學(xué)習(xí)

筆者最近在做一些node端的文件讀寫和分片上傳工作，在這個過程中，發(fā)現(xiàn)node讀取的文件如果超過2G，超過了讀取Blob最大值，會出現(xiàn)讀取異常，此外在node中讀寫文件也受服務(wù)器RAM的限制等，需要分片讀取，本人記錄一下遇到的問題以及解決問題的經(jīng)過?！鞠嚓P(guān)教程推薦：nodejs視頻教程】

node中的文件讀寫

node文件讀寫RAM和Blob大小的限制

其他

一、node中的文件讀寫

1.1 常規(guī)文件讀寫

常規(guī)的，如果我們要讀取一個比較小的文件，可以直接通過：


const fs = require('fs') let data = fs.readFileSync("./test.png") console.log(data,123) //輸出data = 
登錄后復(fù)制

一般而言，同步的方法不是很推薦，因?yàn)閖s/nodejs是單線程的，同步的方法會阻塞主線程。最新版的node直接提供了fs.promise，可以結(jié)合async/await直接使用：


const fs = require('fs') const readFileSync = async () => {     let data = await fs.promises.readFile("./test.png")     console.log(data,123) } readFileSync() //輸出data = 
登錄后復(fù)制

這里通過異步的方法調(diào)用不會阻塞主線程，多個文件讀取的IO也可以并行進(jìn)行等。

1.2 Stream文件讀寫

常規(guī)的文件讀寫，我們會把文件一次性的讀取到內(nèi)存中，這種方法時間效率和內(nèi)存效率都很低，時間效率低是指必須要一次性讀取完畢后才能執(zhí)行后續(xù)才做，內(nèi)存效率低是指必須把這個文件都一次性讀取放入內(nèi)存中，很占用內(nèi)存。因此這種情況下，我們一般使用Stream來進(jìn)行文件的讀?。?/p>


const fs = require('fs') const readFileTest = () => {     var data = ''     var rs = fs.createReadStream('./test.png');     rs.on('data', function(chunk) {         data += chunk;         console.log(chunk)      });     rs.on('end',function(){         console.log(data);     });     rs.on('error', function(err){         console.log(err.stack);      }); } readFileTest() // data = 
登錄后復(fù)制

通過Steam來進(jìn)行文件讀寫，可以提高內(nèi)存效率和時間效率。

內(nèi)存效率：在處理數(shù)據(jù)之前，不需要在內(nèi)存中加載大量（或整個）數(shù)據(jù)
時間效率：一旦有了數(shù)據(jù)，就可以開始處理，這大大減少開始處理數(shù)據(jù)的時間，而不必等到整個數(shù)據(jù)加載完畢再進(jìn)行處理。

Stream的文件還支持第二種寫法：


const fs = require('fs') const readFileTest = () => {     var data = ''     var chunk;     var rs = fs.createReadStream('./test.png');     rs.on('readable', function() {     while ((chunk=rs.read()) != null) {         data += chunk;     }});     rs.on('end', function() {         console.log(data)     }); }; readFileTest()
登錄后復(fù)制

二、node文件讀寫RAM和Blob大小的限制

2.1 基礎(chǔ)問題

在讀取大文件時，會有讀取文件大小的限制，比如我們現(xiàn)在在讀取一個2.5G的視頻文件：


const fs = require('fs') const readFileTest = async () => {     let data = await fs.promises.readFile("./video.mp4")     console.log(data) } readFileTest()
登錄后復(fù)制

執(zhí)行上述的代碼會報(bào)錯：

RangeError [ERR_FS_FILE_TOO_LARGE]: File size (2246121911) is greater than 2 GB

我們可能會想到，通過設(shè)置option，NODE_OPTIONS='–max-old-space-size=5000'，此時5000M>2.5G,但是報(bào)錯還是沒有消失，也就是說通過Options無法改變node讀取文件的大小限制。

上述是常規(guī)的方式讀取大文件，如果通過Steam的方式讀取還會有文件大小的限制嘛？比如：


const fs = require('fs') const readFileTest = () => {     var data = ''     var rs = fs.createReadStream('./video.mp4');     rs.on('data', function(chunk) {         data += chunk;      });     rs.on('end',function(){         console.log(data);     });     rs.on('error', function(err){         console.log(err.stack);      }); } readFileTest()
登錄后復(fù)制

如上方式讀取一個2.5G的文件不會有異常，不過要注意的是這邊有一個報(bào)錯：


data += chunk;                 ^  RangeError: Invalid string length
登錄后復(fù)制

此時是因?yàn)閐ata的長度超過了最大限制，比如2048M等。因此在用Steam處理的時候，在對讀取結(jié)果的保存時，要注意文件的大小，千萬不能超過默認(rèn)的Buffer的最大值。上述這種情況，我們不用data += chunk將數(shù)據(jù)全部保存在一個大的data中，我們可以邊讀取邊處理。

2.2 分片讀取

createReadStream在讀取文件的過程中，其實(shí)也可以分段讀取，這種分段讀取的方法也可以做為大文件讀取的備選項(xiàng)。特別是在并發(fā)讀取的時候有一定的優(yōu)點(diǎn)，可以提升文件讀取和處理的速度。

createReadStream接受第二個參數(shù){start,end}。我們可以通過fs.promises.stat來獲取文件的大小，然后確定分片，最后分片一次讀取，比如：

獲取文件大小


const info = await fs.promises.stat(filepath)    const size = info.size
登錄后復(fù)制

按照指定的SIZE分片(比如128M一個分片)


  const SIZE = 128 * 1024 * 1024   let sizeLen = Math.floor(size/SIZE)     let total = sizeLen +1 ;     for(let i=0;i<=sizeLen;i++){       if(sizeLen ===i){         console.log(i*SIZE,size,total,123)         readStremfunc(i*SIZE,size,total)       }else{         console.log(i*SIZE,(i+1)*SIZE,total,456)         readStremfunc(i*SIZE,(i+1)*SIZE-1,total)       }     }   //分片后【0,128M】,【128M, 256M】...
登錄后復(fù)制

3.實(shí)現(xiàn)讀取函數(shù)


const readStremfunc = () => {     const readStream =  fs.createReadStream(filepath,{start:start,end:end})     readStream.setEncoding('binary')     let data = ''     readStream.on('data', chunk => {         data = data + chunk     })     readStream.end('data', () => {       ...     }) }
登錄后復(fù)制

值得注意的是fs.createReadStream(filepath,{start,end})，start和end是前閉后閉的，比如fs.createReadSteam(filepath,{start:0,end:1023})讀取的是[0,1023]一共1024個bit。

三、其他

3.1 擴(kuò)展瀏覽器端的大文件讀寫

前面將了大文件在nodejs中的讀取，那么在瀏覽器端會讀取大文件會有什么問題嗎？

瀏覽器在本地讀取大文件時，之前有類似FileSaver、StreamSaver等方案，不過在瀏覽器本身添加了File的規(guī)范，使得瀏覽器本身就默認(rèn)和優(yōu)化了Stream的讀取。我們不需要做額外的工作，相關(guān)的工作：github.com/whatwg/fs。不過不同的版本會有兼容性的問題，我們還是可以通過FileSaver等進(jìn)行兼容。

3.2 請求靜態(tài)資源大文件

如果是在瀏覽器中獲取靜態(tài)資源大文件，一般情況下只需要通過range分配請求即可，一般的CDN加速域名，不管是阿里云還是騰訊云，對于分片請求都支持的很好，我們可以將資源通過cdn加速，然后在瀏覽器端直接請求cdn加速有的資源。

分片獲取cdn靜態(tài)資源大文件的步驟為，首先通過head請求獲取文件大小：


const getHeaderInfo = async (url: string) => {   const res: any = await axios.head(url + `?${Math.random()}`);   return res?.headers; }; const header = getHeaderInfo(source_url) const size = header['content-length']
登錄后復(fù)制

我們可以從header中的content-length屬性中，獲取文件的大小。然后進(jìn)行分片和分段，最后發(fā)起range請求：


const getRangeInfo = async (url: string, start: number, end: number) => {     const data = await axios({       method: 'get',       url,       headers: {         range: `bytes=${start}-${end}`,       },       responseType: 'blob',     });     return data?.data;   };
登錄后復(fù)制

在headers中指定 range: bytes=${start}-${end},就可以發(fā)起分片請求去獲取分段資源，這里的start和end也是前閉后閉的。

贊(0)

標(biāo)簽：5G AI GitHub php set source 內(nèi)存域名服務(wù)器瀏覽器騰訊阿里阿里云

相關(guān)推薦

網(wǎng)站地圖滬ICP備18035694號-2

滬公網(wǎng)安備31011702889846號