Vitalik Buterin Price Titok AI用于OnChain图像压缩方法
TiTok压缩方法是由字节跳动和慕尼黑工业大学的研究人员开发的。根据 TiTok 的研究论文,先进的 AI 图像压缩技术可以将 256x256 像素的图像压缩为 32 个离散的 token
优晖·布特林(Vitalik Buterin)支持了新的Token for Image Tokenizer(TiTok)压缩方法,认为这种方法有可能在区块链上得到应用。
不要把TiTok和社交平台TikTok搞混,TiTok的压缩方法使图像大小大大减小,更适合存储在区块链上。
布特林在分布式社交平台Farcaster上提到TiTok的区块链潜力,他说:“320位是基本上一个散列。足够小,可以连上链,每个用户都可以使用。”
这项研发可能会对数字图像的用户头像(PFP)和非可换性token(NFT)的存储产生重要影响。
TiTok的图像压缩
ByteDance和慕尼黑技术大学研究人员开发的TiTok可以将一个图像压缩成32个小数据片段(位)而不会丢失质量。
根据TiTok研究文章,先进的人工智能图像压缩技术使得TiTok可以将256x256像素的图像压缩成“32个分离的标记”。
TiTok是一个1维(1D)图像tokenization框架,它“打破了2D tokenization方法中存在的网格限制,导致图像更灵活和更紧凑”。
“因此,它导致了样本过程的显着加速(例如,DiT-XL/2的410倍快),同时获得了与传统方法相当的生成质量。”
使用机器学习和先进的人工智能,TiTok使用转换器基于模型来转换图像为token化表示。
该方法利用区域重复性,即它找出并使用不同区域图像中的重复信息来减少最终产品的总数据量。
“近期的进展在生成模型方面已经指出了图像tokenization在高解析度图像的有效合成中的关键作用。”
根据研究文章,TiTok的“紧凑的latent表示”可以产生“比传统技术更有效率和有效的表示”。