关灯
护眼
字体:

第239章 幻大数据压缩研究(第1页)

任何一个随机大数据,都有两种可能,一种是可以用极少数的算式就能得出,比如1024的1024次方;另一种是可以用极少数的算式就能近似得出,也就是用一个算式,能够得出重合率达到百分之八十的数值,只需要一些不重合区域的表达式就可以还原。

按照进制,分为十进制大数据,十六进制大数据,二进制大数据。

数据的进制可以转换,而当数据足够大时,进制的转换会导致运算资源占用,也就需要有对应的进制的数据压缩方法。

二进制无理数专用处理器:生成二进制的圆周率,生成二进制的黄金分割率,生成任意正整数的以自身为开方数的数值,阶除——也就是1除以2除以3除以4除以5一直到特定中止位置的取小数部分。

随机重合排列关系专用处理器:在二进制中,随机找出一个无理数(数据卡尺)和一个有理数数据(需要被转化为最短表达式的原始数据)的数据重合部分,把这些重合表达为最短表达式,当然,一个原始数据不可能只采用一个数据卡尺。

发展下去,大数据就需要有专用的数据卡尺服务器,也就是小的数据卡尺服务器,可以常备1000多个数据卡尺,而大的数据卡尺服务器,可以常备千万亿级别的数据卡尺。

数据卡尺越多,越容易生成最短表达式。

数据卡尺的用法:

一元数据卡尺:把原始数据和数据卡尺进行比对,找出其中重合部分,把重合部分记录为数据卡尺引用段落表达式。

二元数据卡尺:把原始数据和两个数据卡尺进行比对,找出其中重合部分,把重合部分记录为数据卡尺引用段落表达式,当不重合出现时,就对数据卡尺进行偏移运算,准备从两个数据卡尺的偏移不进位加法或不进位减法中生成能和原始数据重合的段落,从而只需要记录偏移运算(两个数据卡尺的偏移数据,开始引用段落和结束引用段落终点)和所采用的是不进位加法还是不进位减法。

三元数据卡尺:把原始数据同长度等分为足够短的有限位段落,从而让重合率提高,可以把自身作为数据卡尺,也就是先生成1gb的还原数据,然后以这1gb的数据作为数据卡尺,以此类推。

快速压缩方式:常用于紧急数据转移。

把大数据同长度等分,然后求出其平均数,设立一个个的分组,比如第一个分组,小于4096而大于512的数,出现过多少次……,然后对一个个数据分组进行校验码记录,这种方式优点是不需要动用数据卡尺,也就不需要连接数据卡尺服务器,保密性相对较好,本身可以采用单机方式运作,可用于极限情况下的数据转移,缺点是后期还原难度相对引用数据卡尺要高,后期数据还原需要占用足够多的穷举运算资源。

一般情况下,都是采用快速压缩方式,作为备份的数据纠错或数据验算区域,作为一种保险方式,避免压缩文件被部分篡改或传输错误导致的数据不可用。,,

m.yaxindalian.com 格格党
读者请注意本站网址即将更改为www.yaxindalian.xyz请保存

投喂病弱男配可乐姜汤txt从穿成外道女修起 无防盗夏桀流放地四合院之开局一甲子内力作者佚名修仙界占卜大师TXT奇书网过来抱抱我 电视剧豆瓣遮天帝尊谁教你这样用人皇幡篱笆好文学民国开局一个位面穿越生万物的推荐七零随军干部千金霸榜家属院 全部章节黑龙江古代叫什么流放地谎话精铁扇公子和忍者恋爱吧TXT百度无敌赘婿方天涯书包网王者诺丽获评行业十强品牌神一样的男人免费阅读魔法少女怎么变成魔法报告爱神之酒河边草书评苟道修仙我的渔船无限升级在线阅读免费过来抱抱我简介重生靠科研的女世子连续剧全集免费观看穿成软饭硬吃的炮灰前任后by柠檬橙子柚子的关系你告诉我她们都是真的? 魂燚顺的不行T穿越生万物的没人告诉我魔法学校一群神经呀全文txt辞职后老板成了前男友txt百度大明皇太孙动漫仙帝奶爸在都市叶无辰勇者世界免费阅读驭房我不止有问心术 列表唯有香如故txt穆朝朝四合院之街溜子红尘问道最新李来福仙武帝尊昊天穿越到魔法少女的宝可梦乌托邦退出游戏修仙界占卜大师TXT重生后被渣男死对头宠上天全集免费请和我恋爱by桃晏搜索重生动漫兵者在前夏冰洋边疆悍卒从阵前卒杀到并肩王! 笔耕不辍小太子奔现需谨慎_苏芒穿越万物的爱穿越之我能洞悉万物五个灵异大佬争着要娶我txt兼职爱豆指北广播剧百度穿越生万物