安庆大理运城常德铜陵江西
投稿投诉
江西南阳
嘉兴昆明
铜陵滨州
广东西昌
常德梅州
兰州阳江
运城金华
广西萍乡
大理重庆
诸暨泉州
安庆南充
武汉辽宁

能否把1GB的数据压缩到1MB甚至更小的体积?

1月9日 莫思归投稿
  1GB的数据确实可以压缩到比1MB更小的体积。
  比如1。56GB的数字1,如果用txt文本的形式表示出来就会出现满大屏的1,但压缩过后的压缩文件可以描述为:1。txt里有多少个1,解压缩可以新建一个名为1。txt的文件,然后往里面写入相应数量的1。1。txt里有多少个1只会占用磁盘的几KB的空间,而1。txt里真的写入这么多个1后,就会占用1。56GB的磁盘空间。
  但是如果生成一个随机字符组成的。txt文件,不管用任何压缩软件都很难压缩得动。
  压缩软件压缩文件其实就是在找规律,利用数据的一致性和可预测性去实现压缩的目的。一般来说可以用比较精确的自然语言来描述一样事物,那么就越能够对这样事物做压缩。写出1万个1和说1个万1实际意义不一样,但所表达的意思是一样的。
  由此可见压缩后的文件大小是由文件本身的属性和压缩算法共同决定。
  如果在一只注射器里装满空气,然后堵住出口,适应按压注射器推进装置可以将空气压缩到很小很小的的体积,当压力释放的时候注射器的橡皮阀也会回退到原来的位置。如果往注射器里装满水,堵住出口后,用力按压注射器推进装置里面的水几乎体积不变。通过这个小实验我们就能很好地理解文件本身的属性到底是个什么东西,它决定了数据可压缩的程度。
  为什么说算法也决定了文件的压缩大小呢?
  算法所带来的实际效果是颠覆性的,比如算从1到100的和,从1一直加到100既费纸又费时间,还很可能中途会算错。如果找到规律仅仅只需要头数尾数的和再乘以末尾数的一半,几秒钟就可以心算出答案。
  当然算法的绝对优势建立在数据的规律性之上,而文件压缩同样是建立在数据的规律性进行压缩。但话又说回来压缩率高并不代表就一定好。如下图,从1100的数,我们可以通过不同的程序算法将它输出到屏幕上显示出来。将1、2、3、4、5、6、7、8、995、96、97、98、99、100直接输入到程序中,然后通过程序直接输出到屏幕上。定义一个变量i,i初始值为1,输出到屏幕上后i1,然后再输出。重复99次,就将从1100的数全部输出到屏幕上了。定义一个数组,初始值为{1,2,3,4,5,6,7,8,9,10},输出到屏幕上,再定义一个数组,值为第一个数组里的数加10,输出到屏幕上。重复9次,就将从1100的数全部输出到屏幕上了。
  算法一因为要花很多的时间将全部要显示的数都写进程序内,所以程序本身所占的存储空间是非常大的,这也意味着打开它很吃内存。算法二写出来的程序所占用的存储空间是最小的,但它需要CPU的计算量是最大的。算法三对算法一、算法二的优点、缺点进行了折中,在程序不占用过多存储空间的前提下,也让CPU计算量减少。这就可以充分地解释为什么有的压缩解压软件压缩率很高但很耗时间、很耗CPU和内存;有的压缩解压软件压缩率压缩率一般但很快能压缩、解压。每次压缩、解压都很快的软件是不存在的,因为并不是每一个文件都会遵循程序设定好的套路走。有损压缩也是我们常会用到的一种压缩形式
  有损压缩顾名思义就是会裁掉一些我们用不到的数据,仅保留我们需要的数据。比如下图的美女图片,将颜色和细节信息删除掉仅仅保留线图我们还是可以认出她是一位美女。通过有损压缩的方式是完全可以将1GB的文件压缩1MB或者更小。当然有损压缩是具有破坏性的,压缩后的数据是没有办法恢复到压缩前。
  但有损压缩却是我们经常会用到的,比如图片压缩、音频压缩、视频压缩,人们看图或者显示画面的时候并不会主要到一些细节并不完善,同样即使两个音频录音采样序列可能听起来一样,但实际上并不完全一样。
  文档压缩解压离我们渐行渐远
  在过去网速慢而且贵的情况下,充分的体现了压缩解压的优势所在。如今网速飞快、每GB存储空间白菜价的年代能用到压缩解压的人越来越少。在软件、硬件都不断升级的前提下,人们也更加倾向于欣赏无损的图片、音频、视频。
  其实压缩的技术用途还是非常广泛,比如现代通信,只有当信息的发送方和接受方都能理解编码机制的时候压缩数据通信才能工作。
  以上个人浅见,欢迎批评指正。
  认同我的看法,请点个赞再走,感谢!
  喜欢我的,请关注我,再次感谢!
  这个真的是可以的,只是一种可行的方法,没有现成的技术,把记录信息的二进制码转换成为10进制,然后把小数点移动到最前面,这样会得到一个小于1且非常长的小数,理论上可以用两个较短的数字做除法得出前面要表示的10进制特长小数,可以用剩余的空间记录计算方法,有限位,编码形式等数据。只是这样会特别考验电脑的计算能力,尤其是加密的时候计算量会特别大,现阶段电脑无法完成这样的任务,相信以后会的〔呲牙〕〔呲牙〕〔呲牙〕
  得看你的数据内容啦,如果全都为0x00,那就好办啦!不过楼主肯定不是说这种数据,我觉得网上的一部1G大的视频,可是可以压缩,但是是有损的,且压缩后不可逆,以目前的技术来说很难实现吧!
  你没明白压缩是什么意思吗?1111111111占用十个位置我用10个1表示就是四个位置就压缩了一半多。你1G的压缩成1M的是压缩了1024倍,除非这1G是无意义的重复数据。压缩率涉及到压缩算法比较复杂,但基本的原理你得知道,不是说像个棉花一样物理上压实。
  数据压缩不是万吨水压机!
  数据压缩的机制是数据里有重复,可以重新编排,节省空间。或用规律表征数据。
  比如五星红旗,大面积红色,就可以用(100,255)表示随后有100个255色号的点,数据从100个字节缩小为2个字节。
  一般BMP格式图片压缩成JPG压缩率1025。
  矢量字库就比点阵字库占用空间小得多。
  并不是所有文件都可以压缩!压缩算法也有极限,即便是有损压缩也有可接受程度。
  你说1G数据能不能压缩成1M,不抬杠,是完全可能的!一幅画面巨大的五星红旗或夜空中的
  曾经看过一篇科幻小说,一根水晶柱,刻一道印迹就能把全世界数据都包含了。方法是总长和印迹位置比值无限细分,只要有足够的分辨能力,巨量数据就可以存储识别。理论上可行!
  一串数压缩极限就是ab,寻找合适的a和b就是压缩算法的终极目标。
  压缩方法楼主自己已经把答案说出来了啊:1GB的数据
  虽然听起来是玩笑一样的答案,但事实上已经涵盖了压缩方法的核心要点。
  压缩分为无损压缩和有损压缩,区别在于无损压缩可以根据压缩的结果逆向推导出完整的原数据,而有损的只能还原部分。
  无损压缩的核心是根据数据的规律用简化的方式表达,比如0000000000可以表达为10个0,反过来当你拿到10个0这样的压缩后数据时,可以还原成0000000000。举个例子,一张256256像素的纯黑图片,其对应的原始数据就是256256、rgb均为0的一个文件,而理论上,你也可以用以上表述作为这张图片的压缩结果。
  而有损压缩则会丢失部分数据的内容。说回一开始的调侃,题主所说的1GB的数据可能是一个游戏、一部电影或者一张图片,但是用题主的压缩方式,只保留了数据大小这一信息,其他信息均被丢失,但也成功的将数据进行了大幅压缩。举个现实一点的例子,一张256256的,每行像素都是从rgb均为0递增到rgb均为255的灰度渐变图,如果用数相同数字个数的方法已经无法有效压缩。但是此时如果对整张图片进行二值化处理,所有大于等于128的我当做255,所有小于128的当做0,此时图片就变为了左黑右白的两个色块,而整体图片也可以利用数相同数字的方法压缩,但是此时图片与原本渐变色已经相去甚远。但是如果我的压缩不是二值化,而是三值呢?图片变为了黑、灰白,四值变为黑、深灰、浅灰、白,当达到一个人类很难分辨的情况时,也就无需原本的保留原始数据了。
  归根结底,压缩的极限看两点,数据原本的规律和最终实用的需求。
  PS:给你举个极限压缩的例子,我能把无穷多的数据压缩到一个字节,3。14159265358979323846
  还真有,要看什么数据,十年前就见过。
  长达15分钟的3D动画,内容包括178MB多媒体纹理、159MB的Wave文件、12条音轨、8亿5千万波样等,未压缩前的体积是1。9GB,压缩后小到只有64KB,即压缩比达到30000:1。
  其实,这些画面是经过计算生成的,但是对电脑性能要求却极低,只要奔腾2以上处理器、256MB以上内存就能运行,这是制作者自己说的,奇客也没有古董电脑测试。
  压缩比最高的应该是7Z极限压缩,但这也要看文件类型,比如奇客想把一张坏光盘做成镜像文件,结果其实数据都是0,但7Z压缩后68KB,要比WinRAR的24KB要大。
  还有视频处理,比如Premiere导出1080P格式MP4,H265比H264压缩比要高,但是码率决定清晰度,1GB源文件是无法压到1MB以下,那样码率可能只有10Kbps,输出效果惨不忍睹。
  都是0,那就压成0和0的个数。几个字节就行。关键是都是0,有啥意义吗?你试试压缩一部电影,压来压去还是95以上的压缩率
  关于这个问题,是不能给出一个关于一般数据的统一答案的。针对数据的不同,答案也不同。
  数据能够被压缩,最重要的关键就是数据中是否含有没有意义的信息、冗余的信息,或者是规律性。这里,我说的是无损压缩,就是数据中的任何信息都没有丢失。
  举个例子,在矩阵中,有一种叫做稀疏矩阵。稀疏矩阵中的0元素占大多数,那么,这个稀疏矩阵的信息就是可以压缩的。具体的压缩算法就是只记录下来非零元素的位置即可。因为非零元素占少数,因此,这比机械的表示整个矩阵要节省很多空间。举个类似的例子,如果你的这个1GB的数据,其中记录的全部都是数字,只有第一个数字是1,其余全部都是零。那么,你只要将一共有多少个数字,其中第一个数字是1,其余全部都是0这个信息记录下来就可以了。这远远要小于1GB的数据量。
  另外我举一个有规律性的例子。比如圆周率PI是无限不循环小数。如果把这个小数记录到一个1GB这个大小,那么单纯分析数字本身毫无规律可言。这个时候任何的压缩都是无法保证无损的。但是如果你知道这个数据就是PI,那么你的解压缩算法可以就是一个能够不断计算出PI更多位数的算法,可以在解压缩运算中生成原来的1GB的数据。这个极端的例子,可以让数据被压缩到零,因为解压缩数据完全由算法就可以完成了。
  这个例子也充分说明,离开了具体的数据,去谈压缩率是没有意义的。
  我认为,没有任何规律,没有任何冗余信息的数据,是不能被压缩的。
  问题的最后,我给你分享一个计算机世界之外的信息高度压缩的例子。这个例子,能够充分地体验出造化是多么了不起。人类的发明与之相比,简直太小儿科了。
  一个人类的受精卵,到婴儿出生的时候会发育成大约2000亿个细胞。如果把这理解成解压缩的过程,而所有的解压缩算法都蕴含在这个小小的受精卵中,而更神奇的是,如此巨大的解压缩量,是靠从外界获得输入不断补充成长出来的。
  换句话说,也就是人类的受精卵,是被压缩到1的数据,而这个数据中本身又包含了能把数据解压缩成世界上最高等级的新生命的算法。既是数据,又是算法,而且高度压缩。
  无论是解压缩的算法,还是从外部获得物质帮助自己解压缩的过程,都是硅基生命难以望其项背的。
  hash算法能把任意文件编码成一个唯一的256位字符串,如果你能拥有全世界上任意一个hash对应的原始文件,你就可以做到任意长度的文件压缩到256b。
  当然,世界上没有人有这能力,但这并不能阻止大家使用这种模式。我们经常的软件中就有使用这个压缩算法的,他就是网盘。
  相信大家在使用网盘上传一些下载来的电影或某些软件的时候会发现时不时的会触发秒传,这种就是网盘客户端在你电脑上先把要上传的文件进行hash,再把hash值上传到服务器查找,如果能找到对应的hash码,则说明这个文件服务器已经有了,你要上传的话,只是把这个hash码标记到你的网盘里就行了。
  所以这算不算压缩呢?
投诉 评论 转载

4000元和2000元手机有什么区别?除了价格,这3点差距最总有人把性价比这个词放在嘴边,但真正懂手机的朋友都知道,想要把手机做成高端品牌,就必须和性价比这个词脱开关系,华为、三星以及苹果的高端手机性价比都不高。这些售价超过400……如果一个人坚持学英语,有一天突然不看字幕也能看懂美剧及电影是有一天晚上,老公又捧着手机追看《权力的游戏》,11点都过了,还在看。我躺着睡,听着剧中对话,怎么也睡不着,于是就闭眼静听,听着听着,突然发现人物对话居然能听懂了,瞬间,我激动了……来分一杯羹?大众点评成立新公司含共享单车服务读创深圳商报记者涂竞玉随着共享电单车投放规模持续扩大,以及大众共享出行意识的提升,共享电单车的日常使用率进一步提高。数据显示,2021年中国共享电单车的数量接近40……秋招算法岗灰飞烟灭,应届硕士如何拿到互联网大厂offer?如何看待2021秋招算法岗灰飞烟灭?你会被硕士海归、顶会论文、TOP竞赛劝退吗?应届硕士0顶会0比赛能拿到大厂offer吗?35岁会面临失业吗?算法岗职业发展……私域流量兴起的当下,企业主该何去何从?现在,各种各样的概念满天飞,无外乎就是想收割韭菜。当然,小白和韭菜太多,镰刀不够用。因此,每个人都要不断提高认知,要有起码的辨别能力。由于,我们处在移动互联网……买手机不能小气,2022年4月口碑最好5款手机,用个5年不成基本上今年上半年的手机发布会都已经到四月份告一段落,下个月基本上不会有高端旗舰机的发布了,很多朋友最近都在纠结买什么手机能用35年,其实要想用的久,在选择手机上还真不能小气,给……Python二分查找法今天分享的主题内容是:二分查找法。在开启今天分享的内容之前,我们一起先来了解除法相关的运算符知识。Python中与除法相关的三个运算符是和和:,这是传统的除法,52……代表上会从生活出发数据滥用算法歧视如何管?(两会人物)代表上会从生活出发:数据滥用、算法歧视如何管?中新网福州3月3日电题:代表上会从生活出发:数据滥用、算法歧视如何管?记者龙敏互联网上,只要点开看过……能否把1GB的数据压缩到1MB甚至更小的体积?1GB的数据确实可以压缩到比1MB更小的体积。比如1。56GB的数字1,如果用txt文本的形式表示出来就会出现满大屏的1,但压缩过后的压缩文件可以描述为:1。txt里有多……小米11T11TPro价格泄露售价约合37984940元起小米11T11TPro手机目前已经官宣,将于9月15日在海外发布。这两款手机有望分别配备联发科天玑1200、高通骁龙888芯片,确认将支持120W有线快充。根据外媒Win……年中行业观察丨工业互联网向纵深发展加速落地释放倍增效应今年上半年,工业互联网政策利好不断出台,平台应用加速落地,5G工业互联网赋能垂直行业释放叠加效应。工信部数据显示,截至目前,我国已培育100个以上具有行业特色和区域影响力的工业……抄袭鸿蒙?小米12被骂惨了眼看着小米12就要下周三发布了。但似乎,这次小米对12系列的宣传预热不像之前那样热火朝天?这都周五了,有价值的信息还是很有限。就连这个宣传图也感觉平平无奇。这……
越南市场国产被三星反杀,realme缩水近一半华为Mate新机坐实,还是有麒麟芯片,预装鸿蒙3。0,不负等2022年最值得期待的几款手机,看看你喜欢哪款30省份敲定新基建施工图13地将新建42。5万个5G基站最新智能硬件报告出炉OPPOFindX3或成最香旗舰体美身健魅力无限,华为智选mobifitness动感单车对标冰箱细菌繁生度堪比马桶?做好清洁不存在的iPhone14系列9月推出有哪些可期待的新功能15万以内,能不能造出好的智能汽车?怎么样在旧电脑上安装Windows11?这么简单的教程我相信4月快递业绩发布,申通领涨通达系,圆通跟涨泰坦科技遭实名举报IPO过程中存股权代持公司回应没听说

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找七猫云易事利