THU FASTsys Research Group

    

个人简介

  • 汪毛毛,中国地质(北京)大学信息工程学院研究生,指导老师为张广艳老师。主要研究方向为云日志存储和数据压缩,致力于构建绿色、集约、高效的数据存储系统。

学术经历

  • 2016.09 - 2020.06,东华理工大学(工学学士学位)
  • 2021.09 - 2024.06(预计)中国地质大学(北京)信息工程学院(工学硕士学位)

研究内容 *随着各个工业领域的日志数据规模不断扩大,存储这些日志数据所面临的压力也变得越来越大。最新的日志专用压缩方法利用日志模式将日志解析成细粒度存储单元,然后使用重量级压缩算法直接压缩处理,进而实现了对日志数据的高密压缩。然而,这一方法因需要使用重量级压缩算法因而存在着较高的压缩延迟。本文通过对细粒度存储单元中的数据进行观察和实验分析,发现这些数据中存在局部重复和局部递增的特征。基于这些数据特征,提出了一种数据特征区间感知的编码方法。该方法通过利用和局部数据特征相契合的轻量级编码来处理细粒度存储单元的数据,然后再使用重量级压缩算法对编码后的数据进行压缩处理,能够有效解决数据压缩过程中的压缩延迟问题。

爱好特长

  • 篮球爱好者
  • 跑步、羽毛球爱好者