business@jiangxingai.com

突破传输瓶颈!江行智能联合清华等高校实现3DGS模型“分钟级”压缩传输

2025-09-23

近年来,3D Gaussian Splatting (3DGS)技术迅速成为三维场景重建的重要手段,被广泛应用于沉浸式视频、远程操作和实时渲染等场景。

然而,高质量的3DGS往往伴随海量数据,对传输和存储造成巨大挑战。

现有压缩方法或需要手动调节超参数、或依赖retraining,在网络带宽波动的产业场景中难以快速适配,不仅造成资源浪费,更导致用户体验大幅下降,成为制约3DGS技术在实际产业中规模化落地的关键瓶颈。

针对这一问题,江行智能联合清华大学、德克萨斯大学奥斯汀分校等高校联合开展攻关,研究成果《SizeGS: Size-aware Compression of 3D Gaussian Splatting via Mixed Integer Programming》被国际顶会ACM Multimedia 2025接收。

文章提出了一种名为SizeGS的大小感知编解码器,它能根据用户预设的文件大小预算,快速、智能地寻找最优的压缩参数,从而实现高效压缩并保证视觉质量。

SizeGS:让3DGS压缩越算越“聪明”

研究团队通过深入分析,将3DGS模型的压缩问题,即在文件大小限制下最大化视觉质量,首次建模为一个复杂的混合整数非线性规划(MINLP)问题。

为解决MINLP求解困难的问题,SizeGS框架采取“分而治之”策略,将其解耦为两个更易处理的子问题:首先确定离散的保留率,然后通过整数线性规划(ILP)求解器来优化位宽设置。这种巧妙的解耦方法使SizeGS能够在数秒内完成超参数搜索,显著提升处理效率。

团队通过分析3DGS压缩流程,发现保留比例(reserve ratio, τ)与量化比特宽度(bit-width, Q)是影响压缩结果大小的关键超参数。为此,提出以下创新点:

MINLP建模与问题解耦:将超参数搜索形式化为混合整数非线性规划(MINLP)问题,以“最大化视觉质量、满足目标大小”为优化目标。论文进一步将问题分解为两步:离散采样τ:选择合适的保留点比例;ILP求解Q:利用0-1整数线性规划快速确定各属性的比特宽度配置。

质量与尺寸估计器:为避免每次迭代都进行耗时渲染评估,团队设计了量化损失估计器来替代PSNR,并构建了线性尺寸估计器,精确预测压缩文件大小。

并行加速与分层求解:借助CUDA实现并行量化,加速超参数搜索;同时采用“先通道级、再组内级”的分层ILP策略,在巨大搜索空间中实现分钟级收敛。

分阶段微调:在压缩后引入分阶段微调策略,有效恢复画质,使无训练压缩方法的表现接近甚至追平依赖retraining的先进方法。

图片

实验结果:一分钟内完成尺寸感知压缩

在Mip-NeRF 360、Tank & Temples 和 Deep Blending等多个3DGS数据集上的实验表明,SizeGS在压缩效率和画质保持方面均展现出显著优势。

与现有方法相比,其超参数搜索速度最高可快八倍,能够在一分钟内完成满足目标大小的压缩,并在相同大小预算下依然保持稳定的视觉质量指标(PSNR、SSIM、LPIPS),媲美甚至超越当前主流先进方法。

更重要的是,经过有限微调,在性能上已经能够替代依赖retraining的在线方法,显著节省训练成本。

在动态4DGS场景实验中,SizeGS同样显示出良好的扩展性,能够稳定实现目标大小,并在短时间微调后恢复出色的画质。

图片

SizeGS不仅在离线压缩方面取得了业界领先(SOTA)的性能,其经过微调后的压缩效果也可与耗时较多的在线压缩方法相竞争,为3DGS在云渲染、在线流媒体等实际应用场景提供有效技术支撑,也为未来类似模型的智能压缩提供了新的思路和方法。

应用价值:为产业落地提供关键技术支撑

江行智能立足产业实践,将3DGS、SizeGS等深度融入无人机巡检、具身智能机器人等核心场景,让前沿技术从实验室走向工业现场,切实解决3D数据处理痛点。

激光点云重建与实时建模,快速辅助确定点位

传统点云处理依赖“点云→网格化→渲染”流程,但存在效率低、数据质量不足等问题,难以实现实时可视化。3DGS通过连续的高斯分布函数表示三维空间中的几何形状与颜色属性,有效缓解稀疏与噪声影响。高斯分布的可微特性与GPU并行splatting技术相结合,可实现毫秒级百万点云渲染。3DGS通过参数化压缩记录高斯中心、尺度、方向、颜色等信息实现了对模型的紧凑表征,大幅降低存储开销,为在传感器端或移动端的部署铺平了道路。

在变电站、新能源场站巡检与测绘中,无人机搭载3DGS技术可快速生成高精度数字模型。SizeGS能够快速将无人机采集到的高精度三维场景数据进行压缩,在保障数据完整性的前提下,降低传输与存储成本,为电力设施的智能运维、隐患排查等提供了更加高效可靠的技术支撑。

低带宽下无人机实时路径规划与缺陷检测

在变电站及新能源场站的日常运维中,无人机依靠视觉与点云数据进行实时巡检已成为提升效率的关键手段,然而在偏远地区、复杂工业环境下,网络带宽常成为制约实时性的瓶颈。

江行智能将3DGS等技术与无人机巡检系统深度融合,依托点云建模、动态压缩与智能算法协同能力,在低带宽场景下实现“数据轻量化传输、实时路径优化、精准缺陷检测”的全流程突破。

图片

在智能航线规划方面,系统基于自研3DGIS引擎构建高精度设备模型,并借助AI算法全局优化生成无人机巡检航线,在确保飞行安全的前提下合理规划路径,精准避开威胁区域,大幅提升巡检效率与覆盖完整性。

在缺陷检测环节,系统基于三维GIS引擎,可在输电线路、变电站及配网三维模型中,以时间轴为导向,展示缺陷点位、照片等信息,实现缺陷精准检测与定位。

为具身智能机器人提供快速VLN反馈

江行智能具身智能机器人系统,融合多模态感知、视觉语言导航(VLN)、3DGS等技术,使其在复杂变电场景中具备高效自主导航与作业能力。

通过将机器人采集的视觉与点云数据实时转换为3DGS模型,并基于3DGS高精仿真中进行训练(加入噪声、随机扰动),机器人能够快速加载并理解环境布局,为 VLN 反馈提供可靠的环境认知基础。

在此基础上,系统融合语义理解与感知建图能力,构建端到端的导航与决策系统,支撑智能体在复杂空间中实现稳定、精准的路径规划与控制输出,进一步提升变电站运维的智能化水平,为构建“无人值守”场站提供关键技术与装备支撑。

返回列表

business@jiangxingai.com