如何批量提取每个文件大小

鲁达发布于 2023-07-27

背景

 facebook目前存储了2600亿张照片，总大小为20PB，每张照片约为80KB。 用户每周新增照片数量为 10亿。（总大小60TB），平均每秒新增3500张照片（3500次写请求），读操作峰值可以达到每秒百 万次。 考虑到一台标配的服务器的硬盘是10TB，理论上可以存 10TB/80KB=1.3亿张左右的照片。 然而linux服务器的文件索引的设计最多只支持500w左右的文件数，如果超过500w，性能会大幅下降。 在普通的linux文件系统中，读取一个文件包括三次磁盘io:首先读取目录元数据到内存， 其次把文件 中的inode节点装载到内存，最后读取实际的文件内容。由于小文件个数太多， 无法将所有的目录以及文 件的inode信息缓存到内存， 因此磁盘IO次数很难达到每个图片读取只需要一次磁盘IO的理想状态。 因此，facebook的图片存储系统haystack设计采用的思路是: 多个逻辑图片文件共享一个物理文件。 1个物理文件的大小=32MB。因此linux服务器中的文件个数在 10TB/32MB=1024*1024/32=327680..远远小于linux服务器的文件索引的阈值。 照片文件在物理文件中的存放为依次的顺序存放。每个照片文件的存放规格如下: - 1字节的标记位。0代表接下来的照片仍然可用，1代表接下来的照片已经被删除，2代表该物理文件接下来已经没有图片了。 - 4字节的size。标记照片的大小x。 - x字节，照片文件本身。

实现

文件已经到手，现在的目标是，根据规则，将文件的所有图片解出。

读取，循环，写入即可。

代码:

 var fs = require('fs'); var d = ('rf.data'); var b = new Buffer(d); var c = 0; for(var i=0;i<b.length;){ var start = i; var flag = b.slice(start,start+1);//获得标志位 flag = getR(flag); if(flag == 0){ var size = getR(start+1,start+5)); //将图片输出 (c+'.jpg',b.slice(start+5,start+6+size),function(){ con('图片写入完成') }); i = i + 1 + 4 + size; c++; }else if(flag == 1){ var size =getR( b.slice(start+1,start+5)); i = i + 1 + 4 + size; }else if(flag == 2){ i = b.length; } } function getR ( buf ){ return parseIn('hex'),16); }

将BUFFER 转成字符串，buffer内为16进制的，转成string ,则调用Bu('hex');

获得16进制的字符串，然后将字符串转化为10进制的数字

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作，旨在以深度学习研究为目的传播信息知识，内容观点与本网站无关，反馈举报请点击此处；
2.仅供读者参考，本网站未对该内容进行证实，对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告，请读者放心使用！

“如何批量提取每个文件大小,如何批量提取图片中的文字,批量提取文件大小到excel”边界阅读

如何批量提取每个文件大小

如何批量提取每个文件大小相关介绍,工作中，我们对一些重复的工作可能会采取批量的操作，例如：批量创建文件夹，批量提取文件名，批量生成工作表或工作簿，这些批量操作有什么技巧，下面跟我一起来看看！一、批量生成文件夹具体操作步骤如下： 1

如何批量提取每个文件大小

如何批量提取每个文件大小相关介绍,为什么要批量提取PPT中的图片？有些PPT的图片都是经过处理的，特别适合拿来做封面图，所以小编每次做完都是先批量提取，然后保留一份原图，再复制一份进行压缩~ 一、批量提取 1、复制文件避免操作失误，

如何prefab中的资源进行引用转路径

如何prefab中的资源进行引用转路径相关介绍,1. 前言 Java 开发中我们经常要获取文件的路径，比如读取配置文件等等。今天我们就关于文件的路径和如何读取文件简单地探讨一下。 2. 文件的路径文件的路径通常有相对路径与绝对路径。 2.1

如何gpt改mbr格式

如何gpt改mbr格式相关介绍,导读：硬盘分区表有哪些？它们之间的对比怎么查看硬盘分区表？硬盘分区表的配置及转换什么是4K对齐？有什么作用？怎么查看自己的电脑是否是4K对齐？怎样才能4K对齐？硬盘分区表有哪些？它们之

【四虎永久地址】热门精品小说推荐《橙红年代之王者归来》免费小说月底

四虎永久地址相关介绍,··· ······· 第1章王者归来 ··········· 凌晨时分，刘子光走出江北市的火车站，漆黑的天幕上星光熠熠，出站口上方的昏黄的灯泡将他挺拔的身影投射在广场上，看到出站口有旅客涌出，拉客

【王者荣耀兵线刷新时间表】王者荣耀兵线刷新时间规律想要断3路兵线先得知道兵线刷新时间

王者荣耀兵线刷新时间表相关介绍,哈喽各位小伙伴们大家好，这里是小忠游戏解说。今天和大家分享一下王者荣耀兵线刷新时间规律，掌握好兵线刷新时间就能够让你更好的控线和把握节奏。这些细节往往能让你们比别人技高一筹，多学一点总没坏处吧~ 王者

【王者荣耀兵线刷新时间表】王者荣耀:如何轻松掌握兵线的运营，这些细节你要知道

王者荣耀兵线刷新时间表相关介绍,大家好，我是白风，今天给大家带来关于王者荣耀兵线运营的一些细节技巧温馨提示：本篇文章将全面分析王者荣耀兵线运营的一些细节技巧说到兵线，玩过MOBA游戏的玩家都不会陌生，兵线在一局游戏中最基础的组成

【大香蕉尹人在线】小说：总裁发动最大势力竟调查不到她的过往，勾起了他的征服欲

大香蕉尹人在线相关介绍,秦墨阳盯着一脸温柔的夜亦晟，啧啧啧地摇头。 “夜亦晟，你完了。” 夜亦晟闭目，他知道秦墨阳指的是什么。自从乔知夏出现之后，他现在的睡眠越来越依赖乔知夏，也就越来越离不开她。 “男人一旦离不开一个女人

《