New Patents: 42



1. 柔性面部接口

Title (EN): FLEXIBLE FACIAL INTERFACE
Pub. No.: US20260086604

Applicant: Meta Platforms Technologies, LLC
Inventor: Meng Peng, Richard Andrew Sorensen, Simon Morris Shand Weiss
Publication Date: 26.03.2026

Abstract:
本发明公开了一种用于与混合现实头戴式设备(HMD)接合的装置。该装置包括一个用于与HMD表面接合的底盘,以及一个与织物包边框架耦合的面部带。连接结构用于接合底盘框架和面部带;面部带包含至少一个枢轴铰链式结构。装置可包括一个遮挡包覆层。装置还可包括一个面部垫,面部垫与面部带的轮廓形状相匹配,该轮廓形状由面部带的形状决定。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
混合现实头戴式设备;用户舒适性;面部接口设计

Background (发明背景):
头戴式设备在混合现实(MR)环境中提供视觉显示,但散热问题对用户舒适度和硬件性能至关重要。随着VR头显功能增强,尤其是独立设备,散热管理变得更加困难。现有HMD和头带组合可能对用户头部造成压迫,长时间使用会降低舒适度。此外,提升用户舒适度通常需要定制化解决方案和附加结构。

Summary (发明总览):
本发明提供了一种用于混合现实头戴式设备的柔性面部接口装置。该装置通过底盘与HMD表面接合,并利用枢轴铰链式结构实现面部带的灵活调整。面部带与织物包边框架连接,并通过弹簧机制适应用户面部轮廓。面部垫采用弹性材料分布设计,以补偿用户面部产生的压力点,提升佩戴舒适性。遮挡包覆层采用预加载织物材料,并具有纹理表面以增强功能性和耐用性。本发明通过模块化设计和可调节结构,为不同面部形状的用户提供定制化舒适体验。

Key Innovation (核心创新):

  1. 采用枢轴铰链式结构的面部带设计: 技术详解:面部带包含至少一个枢轴铰链式结构,允许其在不同方向上灵活调整。 实现方式:通过弹簧机制,面部带能够线性平移并与HMD的顶部区域接合。 功能或解决的问题:提供更好的面部贴合度,适应不同用户的面部轮廓,提升佩戴舒适性。
  2. 面部垫的弹性材料分布设计: 技术详解:面部垫采用多种弹性材料,这些材料在面部垫中分布以补偿用户面部产生的多个压力点。 实现方式:通过材料分布优化设计,面部垫能够有效分散压力,避免局部压迫。 功能或解决的问题:减少面部不适感,提升长时间佩戴的舒适性。
  3. 遮挡包覆层的预加载织物材料: 技术详解:遮挡包覆层采用预加载织物材料,并在与织物包边框架和面部带的初始和补充接合点处进行预加载。 实现方式:预加载设计确保包覆层在各种使用条件下保持稳定贴合。 功能或解决的问题:提供更好的光遮挡效果,同时增强耐用性和舒适性。
  4. 纹理表面的遮挡包覆层: 技术详解:遮挡包覆层具有纹理表面,其中部分纹理突出于表面。 实现方式:通过纹理设计增强包覆层的功能性和耐用性。 功能或解决的问题:提供更好的触感和防滑性能,同时增强整体结构强度。
  5. 油性添加剂的应用: 技术详解:底盘、织物包边框架和面部带中至少包含一种油性添加剂以防止分解。 实现方式:通过添加油性成分提高材料的耐油性和耐久性。 功能或解决的问题:延长装置的使用寿命,确保在各种环境下的稳定性。
  6. 可调节的面部带轮廓设计: 技术详解:面部带的轮廓形状设计为镜像用户面部。 实现方式:通过可调节的枢轴铰链式结构和弹簧机制,面部带能够适应不同的面部形状。 功能或解决的问题:提供个性化的舒适体验,适应不同用户的面部特征。
  7. 应用于混合现实头戴式设备: 技术详解:装置设计用于与混合现实头戴式设备接合。 实现方式:通过模块化设计和灵活的结构,装置能够与多种HMD型号兼容。 功能或解决的问题:为用户提供更好的舒适性和沉浸感,同时提升设备的整体性能和耐用性。

View Full Patent @ WIPO
View Full Patent @ Google Patents



2. 使用红外光的可穿戴设备佩戴检测

Title (EN): WEARABLE DEVICE PROXIMITY DETECTION USING INFRARED LIGHT
Pub. No.: US20260086232

Applicant: Meta Platforms Technologies, LLC
Inventor: Xiyu Duan, Travis Taylor, Inigo Arnaiz Duenas
Publication Date: 26.03.2026

Abstract:
本发明描述了一种包含佩戴检测的可穿戴设备。该设备包括一个框架,用于佩戴在用户面部;一个安装在框架部分位置的皮肤传感器,该传感器包含至少一个短波红外(SWIR)波长范围的光发射器,以及至少一个用于捕捉反射光的光探测器;以及一个或多个处理器。这些处理器被配置为使光发射器发射SWIR波长的光,获取由光探测器捕捉的反射光特征信号,并根据所获取的信号确定用户是否佩戴该设备在面部。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
本专利涉及可穿戴设备领域,具体为使用红外光进行佩戴检测的技术。

Background (发明背景):
随着智能眼镜、增强现实(AR)和虚拟现实(VR)头戴设备等可穿戴设备的普及,准确检测用户是否佩戴设备变得至关重要。现有的佩戴检测方法容易出现误判,例如将设备放在背包中或戴在头顶而非面部时误判为佩戴状态,导致电池寿命缩短或设备功能无法及时启动,影响用户体验。因此,需要一种更可靠的佩戴检测方法。

Summary (发明总览):
本发明提出了一种基于短波红外光(SWIR)的可穿戴设备佩戴检测方案。通过在设备框架上集成SWIR光发射器和光探测器,设备能够实时检测用户面部的反射光变化,从而准确判断设备是否被佩戴。该方案利用SWIR光对皮肤的高反射特性,结合处理器对反射光信号的分析,实现高准确度的佩戴检测。与传统方法相比,本发明减少了误判,提高了设备电源管理和用户体验。

Key Innovation (核心创新):

  1. 使用短波红外(SWIR)光进行佩戴检测,通过发射SWIR光并捕捉反射信号,利用皮肤对SWIR光的高反射特性实现准确检测。
  2. 在设备框架上集成光发射器和光探测器,确保检测区域覆盖用户面部关键部位,提高检测可靠性。
  3. 处理器对反射光信号进行实时分析,通过信号特征判断设备是否被佩戴,并结合预设算法减少误判。
  4. 当检测到设备未被佩戴时,自动切换到低功耗模式,延长电池寿命并优化设备能耗管理。
  5. 支持多设备协同工作,例如将音频内容无缝转移到智能手表上,确保用户在不同场景下获得连续体验。
  6. 该技术可应用于多种可穿戴设备,包括AR眼镜、MR头戴设备、智能手表等,具有广泛的适用性和可扩展性。
  7. 通过提高佩戴检测的准确性,本发明能够增强用户体验,例如在用户摘下设备时自动暂停内容播放或切换功能,避免用户错过重要信息或内容。

View Full Patent @ WIPO
View Full Patent @ Google Patents



3. 混合现实应用中的空间音效生成

Title (EN): SPATIAL SOUND GENERATION FOR MIXED REALITY APPLICATIONS
Pub. No.: US20260089456

Applicant: Meta Platforms Technologies, LLC
Inventor: Varun Kumar Nagaraja, Gael Le Lan, Christopher Barth
Publication Date: 26.03.2026

Abstract:
本发明提供了一种用于混合现实环境中的音频生成方法。该方法包括基于混合现实环境的音效描述,确定与音效相关的连续音频信号的第一提示和间歇性音频信号的第二提示。将这两个提示提供给一个模型,该模型根据描述音频信号的提示确定至少一个音频信号。模型生成连续音频信号和间歇性音频信号后,将它们组合生成代表混合现实环境音效的复合音频信号。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
混合现实技术,音频生成,空间音效处理

Background (发明背景):
混合现实技术正在改变用户与数字和物理世界的交互方式,但现有的音频生成方法主要依赖于预录制的音频文件或声音库,难以适应动态变化的场景和用户需求。 现有的解决方案无法根据用户描述实时生成高度定制化的音效环境,限制了混合现实体验的沉浸感和互动性。

Summary (发明总览):
本发明提出了一种基于自然语言描述生成沉浸式实时音效环境的方法。 通过分析用户对期望音效环境的描述,系统能够合成环境音效、空间定位和互动音频组件,生成连贯且动态的听觉体验。 该技术不仅能根据用户的即时动作和请求调整音效,还能适应更广泛的环境变化,确保音效与混合现实场景的实时互动。 相较于传统方法,本发明实现了从文本描述到动态音效的自动化生成,提升了混合现实体验的沉浸感和适应性。

Key Innovation (核心创新):

  1. 基于文本描述生成音效环境:通过分析用户提供的文本描述,系统能够自动生成相应的音效环境,解决了传统方法中音效生成依赖预录制音频的问题。
  2. 分离处理连续和间歇性音频信号:系统将音效描述拆分为连续音频信号和间歇性音频信号两个部分,分别生成后再进行组合,确保音效的连贯性和动态性。
  3. 动态空间音效定位:系统能够根据用户在混合现实环境中的位置动态调整音频信号的空间位置,例如让声音随用户移动而变化,增强沉浸感。
  4. 音效参数化调整:系统引入变化参数来控制音频信号的生成,例如调整音量、频率等参数,以适应不同的环境需求和用户偏好。
  5. 实时音效合成与渲染:利用模型实时生成音频信号并渲染到混合现实环境中,确保音效与用户动作和场景变化同步,提升互动性。
  6. 多层次音效组合:系统能够同时处理多种音效的合成,例如环境音效、物体互动音效和用户事件音效,生成复杂的音效环境。
  7. 应用场景与价值:适用于虚拟现实游戏、虚拟旅游、培训模拟等场景,通过提供高度定制化和动态的音效环境,提升用户体验的真实感和沉浸感。

View Full Patent @ WIPO
View Full Patent @ Google Patents



4. 端到端流式关键词检测

Title (EN): END-TO-END STREAMING KEYWORD SPOTTING
Pub. No.: US20260088023

Applicant: Google LLC
Inventor: Raziel Alvarez Guevara, Hyun Jin Park, Patrick Violette
Publication Date: 26.03.2026

Abstract:
一种用于训练唤醒词检测的方法,包括接收包含定义唤醒设备的唤醒词的输入音频序列的训练输入音频序列。该方法还包括将训练输入音频序列输入到记忆神经网络的编码器和解码器中。记忆神经网络的编码器和解码器均包括顺序堆叠的单值分解滤波器(SVDF)层。该方法进一步包括基于训练输入音频序列在编码器和解码器的每个位置生成logit。对于编码器和解码器的每个部分,该方法包括对从训练输入音频序列生成的每个logit进行平滑处理,基于概率分布确定最大池化损失,并根据与训练输入音频序列相关的所有最大池化损失优化编码器和解码器。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
语音识别技术领域,具体涉及流式音频中的关键词检测。

Background (发明背景):
语音激活环境允许用户通过语音与计算机系统交互,系统通过检测唤醒词来区分用户是否在与其对话。现有的唤醒词检测系统通常包括信号处理前端、神经网络声学编码器和手工设计的解码器,这些组件独立训练,导致复杂性和效率低下。此外,不同场景和语言对同一唤醒词的检测需要不同的模型。

Summary (发明总览):
本发明提出了一种端到端的流式关键词检测系统,通过将编码和解码组件集成到一个记忆神经网络中,实现对流式音频中关键词的检测。该系统使用顺序堆叠的SVDF层来构建神经网络,并通过联合训练优化编码器和解码器,从而提高检测准确性和效率。该方法能够同时检测多个关键词,并适应不同语言和地区的语音变化。

Key Innovation (核心创新):

  1. 采用记忆神经网络架构,通过顺序堆叠的SVDF层实现对音频特征的逐层处理和记忆存储,提供了与典型语音时长成比例的固定记忆容量。
  2. 在编码器中引入多窗口最大池化机制,针对每个音素生成多个编码窗口并计算最大池化损失,从而更精准地捕捉关键词的声学特征。
  3. 解码器使用基于词级对齐的端点检测技术,通过可调偏移的解码窗口包含关键词的端点,确保对关键词结束位置的准确识别。
  4. 通过联合优化编码器和解码器,利用可调参数控制编码器损失和解码器损失的相对重要性,实现整体性能的提升。
  5. SVDF层的每个神经元包含独立的记忆组件和滤波阶段,能够对输入帧的音频特征进行独立滤波和记忆存储,提高模型的鲁棒性。
  6. 该系统能够同时检测多个关键词,并适应不同语言和地区的语音变化,减少了针对不同场景训练多个模型的需求。
  7. 应用于智能家居、智能手机和车载系统等场景,能够在低功耗模式下实时检测关键词,提升用户体验并降低资源消耗。

View Full Patent @ WIPO
View Full Patent @ Google Patents



5. 基于上下文建模的定制化关键词检测

Title (EN): CUSTOMIZED KEYWORD SPOTTING USING CONTEXTUALIZED MODELING
Pub. No.: US20260088020

Applicant: Meta Platforms Technologies, LLC
Inventor: Tyler Vuong, Ming Sun, Zhaojun Yang
Publication Date: 26.03.2026

Abstract:
一种通过修改训练标签来训练上下文化定制关键词检测模型的方法。该方法使用修改后的训练标签,这些标签包括在真实转录文本中同时出现在输入偏置文本中的词语,然后使用损失函数对模型进行训练。这种方法无需额外的对齐或词语分割数据即可构建定制化的关键词检测模型。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
语音识别技术领域,具体涉及定制化关键词检测模型。

Background (发明背景):
关键词检测系统通常用于语音助手和其他语音控制设备的交互第一阶段。传统关键词检测模型只能识别预定义的固定关键词集,难以适应用户多样化的输入需求。随着系统功能扩展,需要更广泛的词汇库来有效操作电子设备并对用户输入做出更灵敏的响应。

Summary (发明总览):
本发明提出了一种基于上下文连接主义时间分类(CTC)建模的定制化关键词检测方法。通过输入音频、对应转录文本和随机选择的输入偏置文本对模型进行训练,修改训练标签以仅包含与输入偏置文本重叠的词语。模型通过音频编码器处理输入音频,通过文本编码器处理输入偏置文本,并使用文本偏置层结合音频和文本嵌入进行预测。在推理阶段,通过提供目标关键词作为输入偏置文本,模型能够实时检测任意指定的关键词,无需重新训练。

Key Innovation (核心创新):

  1. 提出了基于上下文CTC建模的定制化关键词检测方法,通过修改训练标签,仅保留与输入偏置文本重叠的词语,从而实现对目标关键词的精准检测。
  2. 设计了音频编码器和文本编码器,分别处理输入音频和输入偏置文本,并通过文本偏置层将两者嵌入结合,增强了模型对目标关键词的识别能力。
  3. 使用CTC损失函数进行训练,确保模型在预测时能够有效区分目标关键词和其他语音内容,提升检测准确性。
  4. 在推理阶段,通过将目标关键词作为输入偏置文本输入模型,实现了无需重新训练即可实时检测任意指定关键词的功能。
  5. 该方法无需额外的对齐或词语分割数据,降低了训练数据准备复杂度,适用于更广泛的语音识别应用场景。
  6. 应用于可穿戴设备等XR设备中,例如智能眼镜或腕戴设备,能够根据用户指令实时调整关键词检测范围,例如指定特定地点的天气或特定球队的比赛比分。
  7. 独特价值在于提供了一种灵活且高效的关键词检测方案,能够适应用户个性化需求,提升语音交互系统的响应速度和准确性,尤其适用于需要动态调整关键词集的应用场景。

View Full Patent @ WIPO
View Full Patent @ Google Patents



6. 多雷达计算设备系统

Title (EN): System of Multiple Radar-Enabled Computing Devices
Pub. No.: US20260086647

Applicant: Google LLC
Inventor: Lauren Marie Bedal, Leonardo Giusti, Amos Oyedeji
Publication Date: 26.03.2026

Abstract:
本文描述了一种多雷达计算设备系统及相关技术。该系统通过协调多个雷达计算设备之间的信息和操作来创造无缝体验。每个计算设备可以访问存储的雷达信号特征,以实现对用户的检测和区分以及对手势的检测和识别。计算设备可以协调正在进行的操作,以在多个设备之间提供连续性。当放置在不同位置时,每个设备还可以随着时间学习与该位置相关的用户、手势及其变体,以便在未来进行预测。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
智能家居技术领域,具体涉及基于雷达的智能设备交互与多设备协同技术。

Background (发明背景):
智能家居技术通过虚拟助手(VA)技术日益普及,但现有设备通常局限于单个房间,用户在不同房间间移动时体验不连贯。 移动设备虽然可以随身携带,但使用不便。 一些智能家居系统包含多个VA设备,但这些设备之间缺乏有效通信,导致用户体验碎片化。 此外,基于摄像头或麦克风的设备可能引发用户隐私担忧。

Summary (发明总览):
本发明提出了一种基于雷达的多设备协同智能家居系统,通过雷达信号实现用户检测和手势识别。 该系统通过多个雷达计算设备之间的信息共享和操作协调,实现跨房间的无缝体验。 系统能够学习不同位置的用户行为模式,并预测用户需求。 相较于传统基于摄像头或麦克风的设备,本发明通过雷达技术减少了对用户隐私的侵入,同时提高了识别精度和操作连续性。

Key Innovation (核心创新):

  1. 基于雷达的跨设备用户检测与识别技术,通过比较雷达信号特征实现用户身份识别,确保用户在不同设备间的无缝过渡。
  2. 多设备操作协调机制,通过共享雷达信号数据,协调多个设备上的正在进行的操作,例如音乐播放或计时器状态,实现跨房间的连续性体验。
  3. 位置感知的用户行为学习功能,每个设备能够根据其所在位置学习用户的手势习惯和偏好,并预测用户需求,从而提供个性化的智能服务。
  4. 雷达信号特征库的使用,系统存储并不断更新雷达信号特征库,以提高用户检测和手势识别的准确性,减少误判。
  5. 隐私保护设计,利用雷达技术避免使用摄像头或麦克风,降低用户对隐私泄露的担忧,同时不影响设备的功能性。
  6. 设备间实时数据共享协议,通过低延迟的通信机制,确保多个设备之间的信息同步,从而实现无缝的用户体验。
  7. 应用于智能家居场景,例如家庭安防、照明控制、娱乐系统等,提供更智能、更便捷的用户交互方式,同时提升隐私保护水平。

View Full Patent @ WIPO
View Full Patent @ Google Patents



7. 通过PVD涂层合金化/掺杂实现深色表面充电触点和连接器

Title (EN): DARK FINISH CHARGING CONTACT AND CONNECTOR THROUGH PVD COATING WITH ALLOYING/DOPING
Pub. No.: US20260085428

Applicant: Meta Platforms Technologies, LLC
Inventor: Jianer Bao, Yang Li, Isaac Finger
Publication Date: 26.03.2026

Abstract:
本发明提供了一种在设备充电触点上制造深色表面涂层的方法,通过减少金属基底与深色表面涂层之间的肖特基结,以及设备充电触点与充电器之间的肖特基结。肖特基结形成于半导体-金属界面,通过在物理气相沉积(PVD)过程中进行共沉积来减少肖特基结。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
本专利涉及电接触技术,具体为通过物理气相沉积(PVD)涂层合金化/掺杂实现深色表面充电触点和连接器。

Background (发明背景):
消费电子产品中的充电触点和连接器通常需要高耐腐蚀性和低接触电阻,但现有技术多采用贵金属涂层,限制了外观颜色的选择。深色外观的充电触点和连接器需求量大,但现有深色金属如黑镍和黑钌存在耐腐蚀性和生物相容性问题。导电PVD涂层虽提供多种颜色选择,但导电性不足或存在肖特基结问题,限制了其应用。

Summary (发明总览):
本发明提出了一种通过PVD涂层合金化/掺杂制造深色表面充电触点和连接器的方法。其核心思路是通过在PVD过程中进行共沉积,减少金属基底与深色涂层之间的肖特基结,从而实现低接触电阻和高耐腐蚀性。本发明相较于现有技术的主要改进在于解决了深色PVD涂层导电性不足和肖特基结问题,使其适用于充电触点和连接器应用。

Key Innovation (核心创新):

  1. 通过PVD涂层中的共沉积技术减少肖特基结:在PVD过程中,通过共沉积合金化(如钛合金化)或掺杂(如掺杂碳),减少金属基底与深色涂层之间的肖特基结,从而降低接触电阻。
  2. 采用DLC/TaC涂层实现低肖特基势垒高度:使用类金刚石碳(DLC)和/或四面体非晶碳(TaC)作为深色涂层材料,其低带隙特性使得与金属接触时的肖特基势垒高度显著降低。
  3. 解决深色PVD涂层导电性问题:通过掺杂和合金化技术,显著提高深色PVD涂层的导电性,使其适用于充电触点和连接器应用。
  4. 提高耐腐蚀性:使用PVD涂层技术,在铜合金基底上沉积耐腐蚀性涂层,避免使用贵金属,同时保持高耐腐蚀性。
  5. 实现深色外观:提供深色外观的充电触点和连接器,满足消费电子产品对美观外观的需求。
  6. 降低接触电阻:通过减少肖特基结和优化涂层材料,实现接近欧姆接触的电流-电压行为,降低接触电阻。
  7. 应用场景与价值:本发明适用于消费电子产品中的充电触点和连接器,能够提供高耐腐蚀性、低接触电阻和深色外观,提升产品可靠性和用户体验。

View Full Patent @ WIPO
View Full Patent @ Google Patents



8. 织物包裹的透气面部接口

Title (EN): FABRIC WRAPPED BREATHABLE FACIAL INTERFACE
Pub. No.: US20260086376

Applicant: Meta Platforms Technologies, LLC
Inventor: Richard Andrew Sorensen, Simon Morris Shand Weiss, Sarah Hoit
Publication Date: 26.03.2026

Abstract:
本发明涉及一种用于与混合现实头戴式设备(HMD)配合的装置。该装置包括用于与HMD表面配合的底盘;与底盘连接的织物装饰框;与织物装饰框连接的面部带;以及定位在织物装饰框和面部带之间的遮挡包裹。装置还可以包括面部垫,面部垫配置为与面部带的轮廓轮廓配合,该轮廓由面部带的形状决定。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
头戴式设备用户舒适度技术领域,具体涉及混合现实头戴式设备的散热增强技术。

Background (发明背景):
头戴式设备在混合现实环境中提供视觉显示,但散热问题对用户舒适度和硬件性能至关重要。随着VR头显性能提升,尤其是独立设备,散热管理变得更加困难。现有的散热方法包括被动和主动冷却,但这些方法在减少热量产生的同时,难以兼顾不同面部形状用户的佩戴舒适度。

Summary (发明总览):
本发明提供了一种用于混合现实头戴式设备的装置,通过结合织物装饰框、面部带和遮挡包裹等组件来提升散热性能和用户舒适度。该装置利用预加载的织物材料和透气结构来优化热量散发,并通过弹性材料和弹簧设计来适应不同面部形状的压力点,从而在提供沉浸式体验的同时保持佩戴舒适性。

Key Innovation (核心创新):

  1. 采用预加载织物材料制成的遮挡包裹,通过在初始耦合点和补充耦合点处预加载织物材料来维持织物张力,从而有效减少面部与设备之间的空隙,提升散热效率。
  2. 遮挡包裹采用透气材料并具有纹理表面或互联结构成员矩阵,能够调节表面积并过滤或偏振光线,在保证散热的同时提供更好的用户体验。
  3. 面部带设计包含多个弹性材料,这些材料分布在特定位置以补偿用户面部施加的压力点,从而提高佩戴舒适度并适应不同面部形状。
  4. 底盘、织物装饰框和面部带中加入了防油添加剂,防止材料分解,延长设备使用寿命。
  5. 弹簧设计位于织物装饰框顶部,用于接收来自面部带的突起力,确保在面部带与织物装饰框耦合时提供稳定的支撑力。
  6. 遮挡包裹的互联结构成员矩阵能够根据需要调整表面积,从而优化散热性能和佩戴舒适度。
  7. 该装置可应用于VR、AR或MR头戴式设备,通过提升散热性能和佩戴舒适度,为用户提供更沉浸的混合现实体验,尤其适用于需要长时间使用的场景。

View Full Patent @ WIPO
View Full Patent @ Google Patents



9. 基于上下文信息的模糊手势识别

Title (EN): Ambiguous Gesture Determination Using Contextual Information
Pub. No.: US20260086226

Applicant: Google LLC
Inventor: Andrew C. Felch, Eiji Hayashi, Will R. Walker
Publication Date: 26.03.2026

Abstract:
本发明描述了用于雷达设备的模糊手势识别技术及设备,通过使用上下文信息来辅助识别。上下文信息包括雷达设备或其关联设备在当前、过去或未来执行的操作状态、前景和后台操作、存储在内存中的操作历史、计划或预期的操作、用户或设备的位置、房间相关上下文、用户习惯等。两个或多个计算设备可以通过通信网络协调这些上下文信息,形成一个计算系统。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
本发明涉及人机交互技术,具体为基于雷达的模糊手势识别技术,结合上下文信息提升识别准确性。

Background (发明背景):
雷达设备可用于检测用户手势以控制家居设备,但当用户手势执行不准确或不符合预期时,雷达探测器难以正确识别模糊手势,导致操作失败。现有技术通常要求用户精确执行手势或重复操作,降低了设备的便利性和用户体验。本发明旨在解决模糊手势识别中的准确性问题。

Summary (发明总览):
本发明提出了一种基于上下文信息的模糊手势识别方法,通过分析雷达信号特征并结合上下文信息来区分模糊手势。具体实现路径包括检测用户手势的雷达信号特征,将其与存储的信号特征进行比对以初步识别候选手势,再利用上下文信息确定最可能的目标手势。本发明相较于现有技术,通过引入上下文信息提升了模糊手势识别的准确性,改善了用户交互体验。

Key Innovation (核心创新):

  1. 利用雷达信号特征检测用户手势并识别模糊手势,通过比对雷达信号特征将模糊手势关联到多个候选手势。 实现方式:使用雷达系统捕捉手势的时空特征并与存储的信号特征进行匹配。 功能:初步识别模糊手势对应的候选手势集。
  2. 结合上下文信息确定模糊手势的具体含义,包括当前操作状态、设备位置、用户习惯等。 实现方式:通过分析用户行为模式、设备状态和环境信息来推断用户意图。 功能:提高模糊手势识别的准确性。
  3. 支持多设备间的上下文信息共享与协同处理,通过网络连接形成计算系统。 实现方式:多个雷达设备通过网络交换上下文信息并协同工作。 功能:增强复杂环境下的手势识别能力。
  4. 动态调整手势识别策略,根据用户行为模式和环境变化进行自适应学习。 实现方式:利用机器学习算法分析用户历史操作数据并更新识别模型。 功能:提高对用户个性化手势的识别能力。
  5. 在模糊手势识别过程中考虑时间因素,例如手势的持续时间、速度等。 实现方式:通过分析雷达信号的时间特征来区分相似手势。 功能:解决因用户操作速度不同导致的识别错误问题。
  6. 将模糊手势识别技术应用于智能家居、汽车、办公环境等场景。 实现方式:集成到各类雷达设备中并与相应系统联动。 功能:提升人机交互的自然性和便捷性。
  7. 通过减少对精确手势的要求,提升用户体验并降低用户操作难度。 实现方式:允许用户以更自然的方式进行手势操作。 功能:使设备更易于使用,尤其适合老人和行动不便者。

View Full Patent @ WIPO
View Full Patent @ Google Patents



10. 扩展现实系统中鬼影伪影的校正方法

Title (EN): CORRECTION OF GHOST ARTIFACTS IN EXTENDED REALITY SYSTEMS
Pub. No.: US20260086501

Applicant: Microsoft Technology Licensing, LLC
Inventor: Michaela PORUBANOVA, Katri Maria OLKKONEN SAARELA
Publication Date: 26.03.2026

Abstract:
本发明提供了一种用于校正扩展现实(ER)系统显示的全息图鬼影伪影的服务。鬼影伪影是由于显示光在全息图的光学元件上发生背反射而产生的。该服务获取ER系统运行场景的图像,确定鬼影伪影在显示器的视场(FOV)内显示或可能显示的位置,计算鬼影伪影与图像重叠区域的对比度,判断该对比度是否超过鬼影可见性阈值。如果超过,则降低全息图的亮度,使得鬼影伪影与图像重叠区域的对比度降至鬼影可见性阈值以下,从而使鬼影伪影在视觉上与场景融合。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
扩展现实技术领域,具体涉及全息图显示中的鬼影伪影校正技术。

Background (发明背景):
随着头戴式设备(HMD)等可穿戴设备的普及,扩展现实(ER)技术得到了广泛应用。然而,ER系统中的图像质量问题,如鬼影伪影,显著影响了用户体验。鬼影伪影是由于显示光在光学元件间的多次反射造成的,导致图像出现模糊或重影。这种现象不仅降低了图像质量,还可能引起用户视觉疲劳和不适。现有的解决方案,如偏振显示或物理倾斜显示,存在局限性,难以全面解决鬼影问题。

Summary (发明总览):
本发明提出了一种基于人眼视觉系统特性的鬼影伪影校正方法。其核心思路是通过分析场景背景亮度和对比度,确定鬼影伪影的可见性阈值,并动态调整全息图的亮度,以降低鬼影伪影的可见性。该方法无需对硬件进行大幅改动,通过软件算法实现对鬼影伪影的抑制,从而提升ER系统的图像质量和用户体验。

Key Innovation (核心创新):

  1. 通过获取ER系统运行场景的图像,识别鬼影伪影在显示器视场内的位置,实现对鬼影伪影的精确定位。
  2. 计算鬼影伪影与图像重叠区域的对比度,并将其与预设的鬼影可见性阈值进行比较,确保算法对鬼影伪影的检测准确可靠。
  3. 采用基于人眼视觉特性的鬼影可见性阈值,该阈值根据场景背景的颜色和亮度动态调整,以适应不同场景下的鬼影伪影校正需求。
  4. 通过降低全息图的亮度,使鬼影伪影的亮度降至可见性阈值以下,从而在视觉上与场景背景融合,消除鬼影伪影对用户体验的影响。
  5. 该方法无需对ER系统的硬件进行改动,仅通过软件算法实现鬼影伪影的校正,降低了实施成本和技术难度。
  6. 通过减少鬼影伪影对用户视觉的干扰,降低了用户在使用ER系统时的视觉疲劳和不适感,提升了整体沉浸感。
  7. 本发明特别适用于需要高对比度全息图显示的ER应用场景,如虚拟现实、增强现实和混合现实系统,能够显著提升用户体验和产品竞争力。

View Full Patent @ WIPO
View Full Patent @ Google Patents



11. 集成空间音频与人工智能助手的系统和方法

Title (EN): SYSTEMS AND METHODS FOR INTEGRATING SPATIAL AUDIO WITH ARTIFICIAL INTELLIGENCE ASSISTANTS
Pub. No.: US20260089459

Applicant: Meta Platforms Technologies, LLC
Inventor: William Owen Brimijoin, II, Scott Phillip Selfon, Andrew Frederick Francl
Publication Date: 26.03.2026

Abstract:
在一些实施例中,计算机实现的方法包括:确定设备相对于环境的位置,基于确定的位置生成提供环境自然语言上下文描述的空间音频内容,并将空间音频内容呈现给用户,其中空间音频内容根据设备或环境位置的变化动态更新。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
本专利涉及空间音频技术领域,具体涉及将空间音频与人工智能助手结合,用于环境感知和导航。

Background (发明背景):
传统音频导航系统通常依赖静态提示或通用语音命令,难以适应动态环境或提供详细的环境描述。 现有技术无法有效结合空间引导和自然语言描述,导致用户体验受限。 对于依赖音频导航的用户,现有系统无法提供实时且丰富的环境信息。 本发明旨在解决音频导航与环境感知之间的脱节问题。

Summary (发明总览):
本发明提出了一种集成空间音频与人工智能助手的系统和方法。 通过设备定位技术,生成与用户位置相关的空间音频内容。 该音频内容不仅提供环境描述,还可根据用户移动或环境变化实时更新。 系统支持从连续指导到微妙提示的多种辅助级别,适应不同用户需求。 通过动态虚拟音频信标技术,提升用户的导航体验和环境感知能力。 本发明将空间音频与AI助手结合,提供更自然、更智能的交互方式。

Key Innovation (核心创新):

  1. 动态空间音频生成:通过设备定位技术,实时生成与用户位置相关的空间音频内容,实现环境描述的动态更新。
  2. 自然语言环境描述:利用自然语言处理技术,将环境信息转化为易于理解的语音描述,帮助用户更好地理解周围环境。
  3. 实时位置响应:系统能够根据设备位置或环境变化即时调整音频内容,确保用户获得最新、最准确的信息。
  4. 多层次辅助模式:提供从连续指导到微妙提示的多种辅助级别,适应不同用户的需求,例如为视障用户提供详细导航信息,同时为普通用户提供环境提示。
  5. 动态虚拟音频信标:引入虚拟音频信标技术,通过调整音频提示的强度和方向,引导用户更有效地导航并感知环境变化。
  6. 集成AI助手功能:将AI助手与空间音频结合,实现更智能的交互,例如根据用户指令动态调整导航路径或提供特定环境信息。
  7. 应用场景与价值:适用于智能眼镜、AR设备等可穿戴设备,为视障用户、导航需求者以及在复杂环境中工作的用户提供更安全、更高效的音频导航体验。

View Full Patent @ WIPO
View Full Patent @ Google Patents



12. 设备配对技术

Title (EN): DEVICE PAIRING TECHNIQUES
Pub. No.: US20260089777

Applicant: Microsoft Technology Licensing, LLC
Inventor: Shuoqi Scott WANG, Tero J. PATANA, James McColl SHIELDS
Publication Date: 26.03.2026

Abstract:
本发明涉及基于无线指纹与目标计算设备之间关联的设备配对技术。在示例中,检测与附近计算设备相关的无线信号信息,并用于识别匹配的无线指纹。例如,无线指纹可包含多个设备的条目,每个条目可包括设备的信号强度范围。因此,当确定附近设备的信号强度与无线指纹匹配时,可自动与无线指纹相关的目标设备建立连接。这样,无需手动将计算设备与目标设备配对,而是通过识别匹配的无线指纹确定计算设备处于与目标设备相关的环境中,从而自动与目标设备建立连接。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
无线通信技术领域,具体涉及基于无线信号指纹的设备自动配对技术。

Background (发明背景):
传统的设备配对过程对用户来说可能不够直观,尤其在不熟悉设备或相关程序的情况下。此外,不同计算设备之间的差异和不一致性会增加配对过程的复杂性,例如当一个计算设备需要在多个目标设备之间切换使用时,可能需要多次重新配对。这些问题会导致用户困扰、配对延迟或失败,以及计算设备或目标设备的不当行为。

Summary (发明总览):
本发明提出了一种基于无线信号指纹的设备自动配对方法。通过检测周围设备的无线信号信息并生成无线指纹,当检测到的信号信息与预定义无线指纹匹配时,计算设备可自动与目标设备建立连接。该方法通过识别环境中的无线信号特征,简化了配对过程,无需用户手动操作。相较于传统方法,本发明提高了配对的自动化程度和用户体验,并适应了多设备环境下的动态变化。

Key Innovation (核心创新):

  1. 基于无线信号指纹的自动配对机制,通过检测周围设备的无线信号信息(如信号强度、频率等)生成指纹,并与预定义指纹匹配,实现自动配对。
  2. 无线指纹包含多个设备条目,每个条目包括设备标识符、频率范围和信号强度范围,支持多设备环境下的精确匹配。
  3. 引入信号强度范围和匹配度评分机制,允许部分匹配和非精确匹配,提高配对鲁棒性,适应信号波动和设备移动。
  4. 动态更新无线指纹,根据检测到的信号信息调整指纹条目,例如更新信号强度范围或添加/移除设备条目,以适应环境变化。
  5. 支持多种无线通信技术之间的跨技术配对,例如通过Wi-Fi检测信号并通过蓝牙进行连接,提升配对的灵活性和适用性。
  6. 引入权重系统,根据设备类型和信号稳定性为指纹条目分配不同权重,提高匹配准确性,例如为信号稳定的无线接入点分配更高权重。
  7. 本发明可应用于智能家居、办公环境或移动设备场景中,实现设备间无缝自动配对,提升用户体验并简化设备管理。

View Full Patent @ WIPO
View Full Patent @ Google Patents



13. 用于生成与人工智能助手对话交互档案的方法及其使用系统

Title (EN): METHODS FOR GENERATING ARCHIVES OF CONVERSATIONAL INTERACTIONS WITH AN ARTIFICIALLY INTELLIGENT ASSISTANT, AND SYSTEMS OF USE THEREOF
Pub. No.: US20260086650

Applicant: Meta Platforms Technologies, LLC
Inventor: David Peter Roth
Publication Date: 26.03.2026

Abstract:
本发明描述了一种在智能眼镜上与人工智能助手进行对话交互的方法。该方法包括:在智能眼镜上调用人工智能助手后:(i) 接收用户向人工智能助手发出的一个或多个输入;(ii) 通过智能眼镜的摄像头捕获一个或多个图像;(iii) 向用户呈现人工智能助手生成的响应。该方法还包括:在与人工智能助手的会话结束时,生成会话档案,其中档案包括用户输入、捕获的图像和/或人工智能助手的响应。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
本专利涉及智能眼镜上的人工智能对话交互技术,具体包括会话管理、用户输入处理和交互档案生成。

Background (发明背景):
现有的人工智能助手在对话交互中不够自然,用户无法进行持续的对话交流。助手在处理用户请求时需要等待完整响应才能继续对话,导致对话过程冗长且令人沮丧。此外,助手在处理请求时会保持空闲状态,造成对话中的尴尬停顿。用户还可能忘记关闭助手,导致电池资源浪费。本发明旨在解决上述问题。

Summary (发明总览):
本发明提出了一种在智能眼镜上实现更自然的人工智能对话交互的方法。其核心思路是通过智能眼镜的摄像头数据实时识别用户需求,并即时提供相关帮助。实现路径包括:调用助手后自动分析摄像头数据以确定是否需要提供帮助;通过智能眼镜的输出方式向用户传达相关信息;并在会话结束后生成包含用户输入、图像和助手响应的档案。本发明相较于现有技术的主要改进在于实现了更流畅的对话体验,减少了等待时间,并提供了会话记录功能。

Key Innovation (核心创新):

  1. 通过智能眼镜摄像头数据实时识别用户需求: 技术详解:助手调用后自动分析摄像头数据以确定是否需要提供帮助。 实现方式:基于图像识别技术检测用户视野中的物体或场景。 功能或解决的问题:无需用户主动查询即可提供即时帮助,提升交互效率。
  2. 使用指示灯提示助手状态: 技术详解:智能眼镜配备指示灯,通过不同颜色或闪烁模式提示助手状态。 实现方式:指示灯在会话开始时亮起,监听用户输入时闪烁,处理请求时保持常亮。 功能或解决的问题:使用户直观了解助手状态,避免误操作。
  3. 实时中断并响应用户新输入: 技术详解:在助手响应过程中,如果用户发出新指令,立即停止当前响应并处理新指令。 实现方式:通过语音识别技术检测用户的新输入,并即时切换处理逻辑。 功能或解决的问题:实现更自然的对话流,避免用户等待过长。
  4. 提供中间响应以缩短等待时间: 技术详解:在处理完整响应时,先提供简短的中间响应。 实现方式:助手在处理复杂请求时,先给出初步反馈,再补充完整信息。 功能或解决的问题:减少用户等待时间,提升交互体验。
  5. 生成会话档案以记录交互过程: 技术详解:会话结束后,将用户输入、图像和助手响应整合成档案。 实现方式:利用智能眼镜的存储功能记录会话数据。 功能或解决的问题:使用户能够回顾对话内容,并提供数据支持以改进助手性能。
  6. 通过关联设备展示会话档案: 技术详解:将会话档案发送到关联设备,并通过用户界面展示。 实现方式:智能眼镜与智能手表等设备通信,将档案数据同步到用户界面。 功能或解决的问题:方便用户查看和管理会话记录,提升用户体验。
  7. 应用于增强现实和混合现实场景: 技术详解:将人工智能助手集成到增强现实或混合现实环境中。 实现方式:利用智能眼镜的传感器和显示技术,将助手功能与虚拟内容结合。 功能或解决的问题:提供沉浸式交互体验,拓展助手应用场景,例如虚拟导航、物体识别等。

View Full Patent @ WIPO
View Full Patent @ Google Patents



14. 单目显示参数调整以显示内容

Title (EN): ADJUSTMENT OF A MONOCULAR DISPLAY PARAMETER TO DISPLAY CONTENT
Pub. No.: US20260089306

Applicant: Microsoft Technology Licensing, LLC
Inventor: Michaela PORUBANOVA, Gabriele D’Amone
Publication Date: 26.03.2026

Abstract:
一种服务配置与虚拟刺激相关的单目显示参数,以实现在扩展现实(ER)系统的单个显示器上优化显示虚拟刺激。该服务确定ER系统处于单目模式,并访问与虚拟刺激相关的单目显示参数。当ER系统处于单目模式时,服务使虚拟刺激仅在单个显示器上显示,且虚拟刺激使用单目显示参数进行显示。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
扩展现实(ER)技术领域,具体涉及单目显示参数优化和虚拟内容显示。

Background (发明背景):
头戴式设备(HMD)等可穿戴设备越来越受欢迎,它们能够提供扩展现实(ER)体验。ER系统包括虚拟现实(VR)、混合现实(MR)和增强现实(AR)平台。现有技术中,ER系统通过显示虚拟内容来增强用户体验,但单目和双目显示模式下的用户舒适度差异显著,且虚拟刺激的显示参数未针对单目模式进行优化。

Summary (发明总览):
本发明提出了一种优化单目模式下虚拟刺激显示的方法,通过调整单目显示参数来提升用户体验。具体实现路径包括:检测ER系统是否处于单目模式,访问适用于单目模式的显示参数,并基于这些参数调整虚拟刺激的显示方式。本发明相较于现有技术的主要改进在于针对单目模式进行专门优化,从而减少用户不适感并提升显示效果。

Key Innovation (核心创新):

  1. 单目模式检测技术:通过检测ER系统是否仅使用一个显示器来显示内容,从而确定系统是否处于单目模式。
  2. 单目显示参数优化:包括调整内容位置以防止双目竞争和不自然的眼球运动、改变显示亮度以保持内容持续可见、提高刺激对比度等。
  3. 动态调整显示参数:根据单目模式下的用户需求,动态调整显示分辨率、视野(FOV)和焦平面距离,以优化显示效果并减少眼部疲劳。
  4. 虚拟刺激与现实场景的融合:在单目模式下,确保虚拟刺激与现实场景的可见部分同时显示,并通过参数调整实现无缝融合。
  5. 用户舒适度提升:通过优化单目显示参数,减少或消除用户在使用ER系统时的恶心或眼部疲劳等不适感。
  6. 适用于多种ER系统:本发明适用于头戴式设备、手持设备、笔记本电脑等多种ER系统,具有广泛的适用性。
  7. 独特价值与应用场景:本发明特别适用于需要长时间使用ER系统的场景,如工业培训、医疗应用等,通过优化单目显示提升用户舒适度和效率。

View Full Patent @ WIPO
View Full Patent @ Google Patents



15. 根据用户注视方向及其他用户输入调整智能眼镜显示的助手建议

Title (EN): ADAPTING ASSISTANT SUGGESTIONS RENDERED AT COMPUTERIZED GLASSES ACCORDING TO CHANGES IN USER GAZE AND/OR OTHER USER INPUT
Pub. No.: US20260086635

Applicant: GOOGLE LLC
Inventor: Chris Ross, Jarlan Perez, Alexander Chu
Publication Date: 26.03.2026

Abstract:
本发明涉及一种自动化助手系统,该系统能够在智能眼镜的显示界面上呈现可选建议,并根据用户注视方向的变化及其他用户输入来调整这些建议。可选建议最初基于与用户相关的上下文数据生成,这些数据与用户注视的环境中的不同环境特征相关。自动化助手可以识别用户可能感兴趣的环境特征,并在用户对特定特征表现出兴趣时调整可选建议。用户对特定环境特征的兴趣可以通过多种方式表达。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
智能眼镜交互技术, 用户注视感知与响应, 上下文感知建议系统

Background (发明背景):
随着自动化助手在日常生活中的普及,用户可能难以发现其新功能带来的益处。这导致用户可能无法高效地利用助手功能,例如在探索陌生城市时未能意识到可以通过助手与第三方服务互动,从而浪费时间和资源。现有技术未能有效引导用户在陌生环境中使用助手功能。

Summary (发明总览):
本发明提出了一种基于智能眼镜的自动化助手系统,该系统能够根据用户所处环境的特征生成并呈现建议。通过分析用户的注视方向、位置、时间等上下文数据,助手能够提供高度相关的建议。当用户注视特定对象或改变注视方向时,系统会动态调整建议内容,以匹配用户当前的关注点。这种方法不仅节省了智能眼镜的计算和显示资源,还提升了用户在陌生环境中的交互体验。

Key Innovation (核心创新):

  1. 通过智能眼镜的显示界面呈现与用户环境特征相关的建议,并利用用户注视方向和上下文数据动态调整建议内容。 实现方式:使用计算机视觉和传感器数据识别用户注视对象,结合位置和时间信息生成建议。 功能或解决的问题:提供高度相关的建议,避免用户手动筛选大量信息,提升交互效率。
  2. 限制建议数量以适应智能眼镜的有限显示界面,并使用方向性图形用户界面(GUI)元素指示用户当前视野外的建议。 实现方式:分析用户视觉范围,优先显示最相关的建议,并通过小型方向性图标提示其他建议的位置。 功能或解决的问题:在有限显示空间内提供更多信息,同时避免遮挡用户视野,提升安全性。
  3. 根据用户输入和视觉焦点的变化实时更新建议集。 实现方式:监测用户注视方向变化和语音输入,动态调整显示的建议内容。 功能或解决的问题:确保建议始终与用户当前关注点一致,提升交互的准确性和及时性。
  4. 在用户注视特定对象时提供与该对象相关的详细建议。 实现方式:识别用户注视的特定对象(如餐厅),并提供该对象的详细信息(如菜单、网站链接)。 功能或解决的问题:使用户能够快速获取所需信息,无需手动搜索或切换应用。
  5. 通过用户日历等数据源获取事件信息,并将其整合到建议中。 实现方式:与用户日历同步,获取事件地点信息,并在用户接近相关位置时提供建议。 功能或解决的问题:提供个性化的日程提醒和位置相关服务,提升用户对时间的掌控力。
  6. 使用方向性GUI元素将用户注意力引导至视野外的建议内容。 实现方式:当建议内容位于用户当前视野外时,在显示界面边缘显示方向性图标。 功能或解决的问题:帮助用户快速定位感兴趣的内容,同时保持界面整洁。
  7. 应用于智能眼镜的导航、购物、餐饮推荐等场景,为用户提供无缝的增强现实体验。 实现方式:结合智能眼镜的硬件特性,提供实时、位置相关的建议服务。 功能或解决的问题:增强用户在陌生环境中的探索能力,提供更智能、更便捷的日常生活辅助。

View Full Patent @ WIPO
View Full Patent @ Google Patents



16. 用于点像素Mura补偿的系统和方法

Title (EN): SYSTEMS AND METHODS FOR DOT PIXEL MURA COMPENSATION
Pub. No.: US20260087959

Applicant: Meta Platforms Technologies, LLC
Inventor: Byung Geun Jun, Amir Amirkhany, Zhiming Zhuang
Publication Date: 26.03.2026

Abstract:
本公开的计算机实现方法包括通过计算设备从相机接收显示屏幕的一组图像。该方法还包括对图像执行图像处理技术以识别显示屏幕的一个或多个Mura效应以及与Mura效应像素相关的坐标。此外,该方法包括基于图像确定显示屏幕的去Mura算法。基于去Mura算法,该方法还包括生成包含与Mura效应相关的每个坐标以及每个坐标的一组去Mura值的查找表。最后,该方法包括将查找表存储在非易失性存储器中,以使用去Mura值执行Mura补偿过程。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
显示技术领域,具体涉及显示屏幕的Mura缺陷检测与补偿技术。

Background (发明背景):
显示屏幕在生产过程中常出现Mura现象,即亮度不均匀的瑕疵,影响显示质量。 现有技术通常依赖人工检测和补偿,效率低且难以保证一致性。 现有自动补偿方法在识别和校正Mura效应时可能存在精度不足的问题。 本发明旨在提供一种更精确、高效的自动Mura补偿方案。

Summary (发明总览):
本发明提出了一种自动化的Mura补偿方法,通过相机采集显示屏幕图像并进行分析。 核心思路是识别屏幕上的Mura效应并确定其坐标,然后基于图像数据生成去Mura算法。 该方法通过计算生成包含Mura坐标和对应补偿值的查找表,并将其存储在非易失性存储器中。 相较于传统方法,本发明提高了补偿精度和效率,并实现了补偿过程的自动化。 该方案可广泛应用于各类显示设备,包括但不限于LCD、OLED等显示技术。

Key Innovation (核心创新):

  1. 通过相机采集显示屏幕图像并执行图像处理技术,精确识别Mura效应及其坐标。 实现方式:利用图像处理算法对采集的图像进行分析,提取亮度不均匀区域的特征。 功能:实现对Mura效应的自动化检测,提高检测精度和效率。
  2. 基于图像数据生成去Mura算法,确保补偿过程的精确性和适应性。 实现方式:通过分析Mura效应的特征和分布,设计相应的补偿算法。 功能:提供针对不同Mura效应的定制化补偿方案,提升补偿效果。
  3. 生成包含Mura坐标和对应补偿值的查找表,实现高效的补偿操作。 实现方式:将补偿值与坐标对应关系存储在查找表中,便于快速调用。 功能:简化补偿过程,提高补偿速度,适用于实时补偿需求。
  4. 将查找表存储在非易失性存储器中,确保补偿数据的持久性和可靠性。 实现方式:利用非易失性存储器保存补偿数据,防止数据丢失。 功能:保证补偿过程的稳定性和一致性,适用于长期运行的应用场景。
  5. 提供自动化补偿流程,减少人工干预,提高生产效率。 实现方式:通过自动化算法和流程控制,实现补偿过程的自动化。 功能:降低人工成本,提高生产效率,适用于大规模生产环境。
  6. 适用于多种显示技术,包括LCD、OLED等,具有广泛的应用场景。 实现方式:设计通用的补偿算法和流程,适应不同显示技术的需求。 功能:扩展了Mura补偿技术的应用范围,提升了技术的通用性。
  7. 推测本专利可应用于高端设备制造领域,如高端电视、智能手机等。 独特价值:提供高质量的显示效果,提升用户体验,满足高端市场的需求。

View Full Patent @ WIPO
View Full Patent @ Google Patents



17. 金属边缘倒圆及消除FATP贴胶的方法

Title (EN): METHOD OF ROUNDING METAL EDGE AND ELIMINATING TAPING AT FATP
Pub. No.: US20260084198

Applicant: Meta Platforms Technologies, LLC
Inventor: Zhicong Yao, Luke Murphy, Richard Langlois
Publication Date: 26.03.2026

Abstract:
本发明提供了一种方法,包括将工件放置在包含齿部的弯曲块与弯曲工具的台面之间,调整工件位置使工件的毛刺位于弯曲块齿部下方,然后推动弯曲块压紧工件以弯曲毛刺,从而防止对相邻非金属部件的损坏。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
金属加工领域,具体涉及金属边缘倒圆及消除装配测试包装阶段贴胶的技术。

Background (发明背景):
金属部件在消费电子产品如混合现实设备、可穿戴设备中广泛应用。切割后的金属边缘会产生毛刺,尤其在需要将柔性印刷电路板(FPC)缠绕在金属边缘时,毛刺可能导致FPC破损。传统方法通过卷边使边缘圆润,但高强度金属如不锈钢和钨容易开裂。现有技术通常使用聚酰胺胶带贴附尖锐边缘,但这种方法耗时、成本高且增加零件重量。

Summary (发明总览):
本发明提出了一种通过弯曲和锻造金属边缘以实现倒圆的方法,避免了传统卷边方法对高强度金属的限制。该方法无需增加边缘厚度,适用于空间受限或不允许厚度增长的场合。其核心思路是使用专用工具对金属边缘进行轻微弯曲并锻造回位,形成圆润边缘,从而消除对胶带的需求。本发明提供了一种更经济、更轻量化且实施时间更短的技术方案。

Key Innovation (核心创新):

  1. 通过弯曲块齿部对金属边缘毛刺进行定位和弯曲处理,实现边缘倒圆,避免了传统卷边方法对高强度金属的限制。
  2. 弯曲块齿部的曲率半径根据工件厚度和材料特性进行设计,确保弯曲过程不会损坏工件或影响其结构强度。
  3. 采用锻造工艺将弯曲后的边缘压回原位,形成圆润边缘,同时保持边缘厚度不变,适用于对厚度敏感的装配场景。
  4. 该方法无需使用胶带,避免了贴胶带来的成本增加、重量增加和操作时间延长问题。
  5. 工具设计紧凑,适用于空间受限的装配环境,例如消费电子设备的内部结构。
  6. 该技术适用于多种金属材料,包括不锈钢、铝合金等常见金属,以及高强度金属如钨合金。
  7. 本发明特别适用于消费电子产品如MR设备、可穿戴设备等,能够有效提升装配效率并降低生产成本。

View Full Patent @ WIPO
View Full Patent @ Google Patents



18. 基于触摸感应图像的键盘解码

Title (EN): KEYBOARD DECODING USING TOUCH SENSING IMAGES
Pub. No.: US20260086712

Applicant: Google LLC
Inventor: Piyawat Lertvittayakumjorn, Shanqing Cai, Peng Dou
Publication Date: 26.03.2026

Abstract:
计算设备可检测用户在感应式屏幕上的输入。在检测到输入后,该方法获取代表输入的指示,并从这些指示生成触摸感应图像。然后,将从触摸感应图像中提取的信息输入到人工智能(AI)模型中。计算设备将AI模型应用于从触摸感应图像中提取的信息,以基于触摸感应图像生成候选键及其对应分数的分布。从该分布中,选择一个字母数字键,随后将该键输出到设备的用户界面以响应选择。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
本专利属于人机交互技术领域,具体涉及基于触摸感应图像的虚拟键盘解码技术。

Background (发明背景):
虚拟键盘是物理键盘的屏幕版本,广泛应用于智能手机和平板电脑等触摸设备。用户通过点击显示的键进行输入,但小型设备上的虚拟键盘由于键尺寸缩小,容易导致输入错误。现有的键盘解码方法主要依赖用户点击的触摸中心点数据,在处理小键盘、全拇指输入或手指较大等情况下存在不足。

Summary (发明总览):
本发明提出了一种基于触摸感应图像的键盘解码方法,通过人工智能模型分析触摸感应图像来预测用户意图输入的键。该方法首先获取用户输入的触摸感应图像,然后将其输入到AI模型中,生成候选键的概率分布。AI模型结合触摸感应图像和可选的触摸中心点数据,提高了键盘解码的准确性。与传统仅依赖触摸中心点的方法相比,本发明显著降低了字符错误率,提升了用户输入体验。

Key Innovation (核心创新):

  1. 利用触摸感应图像进行键盘解码: 通过捕捉用户输入的触摸感应图像,AI模型能够获取更丰富的空间信息,从而更准确地预测用户意图输入的键。
  2. 结合触摸中心点数据: 在处理触摸感应图像的同时,AI模型还可选地结合触摸中心点数据,进一步提高预测精度,特别是在处理小键盘或手指较大用户时效果显著。
  3. 采用逻辑回归分类器: AI模型使用逻辑回归分类器处理预处理后的触摸感应图像和触摸中心点数据,生成候选键的概率分布,为后续决策提供可靠依据。
  4. 输出标准化预测分布: AI模型输出一个归一化的预测键分布,为虚拟键盘上的所有候选键提供预测权重,总和为1,便于选择预测权重最高的键作为用户意图输入的键。
  5. 降低字符错误率: 实验结果表明,与仅依赖触摸中心点的基线方法相比,本发明将字符错误率相对降低了21.4%,结合语言模型后进一步降低至29.7%,显著减少了用户输入错误。
  6. 提高模型泛化能力: 通过将触摸感应图像转换为热图重叠向量,本发明增强了AI模型的空间处理能力,使其在处理未见过的文本时也能保持较高的预测精度。
  7. 应用于移动设备虚拟键盘: 本发明特别适用于智能手机和平板电脑等移动设备的虚拟键盘,能够在各种用户输入场景下提供更准确的键盘解码,提升用户输入体验。

View Full Patent @ WIPO
View Full Patent @ Google Patents



19. 数字钥匙访问控制

Title (EN): CONTROLLING ACCESS TO DIGITAL KEY
Pub. No.: US20260087181

Applicant: Google LLC
Inventor: Wenhui Kao, Alok Chandel, Eerik J. Helmick
Publication Date: 26.03.2026

Abstract:
一种电池供电的便携式计算设备,包括用于提供对外部安全系统访问的数字钥匙,检测到剩余电池能量已降至高于第一预设水平的第二预设水平,其中当剩余电池能量降至第一预设水平时,至少部分设备被编程为关闭。在检测到剩余电池能量降至第二预设水平后,设备提示用户选择配置,以允许在设备至少部分关闭时使用数字钥匙,并在用户选择的配置允许的情况下,在设备关闭后允许使用数字钥匙。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
便携式计算设备的安全访问控制技术,具体涉及数字钥匙在低电量情况下的访问权限管理。

Background (发明背景):
便携式计算设备(如智能手机和智能手表)常配置数字钥匙技术,用于访问车辆、建筑或保险箱等安全系统。然而,当设备电量过低时,用户可能无法解锁设备,从而无法使用数字钥匙访问安全系统。现有的解决方案允许在设备低电量关闭后无需认证即可使用数字钥匙,但这带来了安全风险,可能被恶意用户利用。

Summary (发明总览):
本发明提供了一种机制,在便携式计算设备因低电量关闭时更好地控制数字钥匙的访问权限。设备在检测到电量降至预设阈值时,会提示用户选择是否允许在设备关闭后使用数字钥匙,并在用户授权后进入相应状态。该方案通过用户认证和配置选择,在保证安全性的同时,解决了低电量情况下数字钥匙无法使用的问题。

Key Innovation (核心创新):

  1. 引入第二预设电量阈值,在设备完全关闭前提示用户选择是否允许低电量下使用数字钥匙,通过用户主动授权来平衡安全性和便利性。
  2. 实现用户认证作为进入低电量数字钥匙使用模式的必要条件,确保只有授权用户才能启用该功能,防止未经授权的访问。
  3. 在设备低电量关闭后,允许在限定时间内无需再次认证即可使用数字钥匙,通过预先配置和用户授权来控制访问权限。
  4. 通过短距离无线通信接口(如NFC或UWB)实现数字钥匙与外部安全系统的交互,确保在设备低电量关闭状态下仍能完成身份验证和数据交换。
  5. 在设备固件中集成安全元件,用于存储和管理数字钥匙,确保即使在低电量模式下,密钥数据也不会被篡改或泄露。
  6. 提供用户界面选项,允许用户根据需求启用或禁用低电量模式下数字钥匙的使用功能,增加个性化配置的可能性。
  7. 该技术可应用于智能门锁、汽车钥匙和智能家居系统等场景,在保证安全性的同时,提升用户在紧急情况下的使用体验。

View Full Patent @ WIPO
View Full Patent @ Google Patents



20. 智能助手对话交互方法及其系统应用

Title (EN): METHODS FOR CONVERSATIONAL INTERACTIONS WITH AN ARTIFICIALLY INTELLIGENT ASSISTANT, AND SYSTEMS OF USE THEREOF
Pub. No.: US20260087801

Applicant: Meta Platforms Technologies, LLC
Inventor: Willy Huang, Nancy Oh, Nicholas Pelczar
Publication Date: 26.03.2026

Abstract:
本发明描述了一种在智能眼镜上与人工智能助手进行对话交互的方法。该方法包括在智能眼镜上无需提供查询即可调用人工智能助手,人工智能助手可访问智能眼镜摄像头提供的图像数据。在调用人工智能助手后,基于摄像头数据确定是否需要向用户提供与图像中物体相关的帮助,并在确定后通过智能眼镜的输出方式向用户传达包含帮助的通信。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
本专利涉及智能可穿戴设备领域,具体为智能眼镜上的人工智能助手对话交互技术。

Background (发明背景):
现有的人工智能助手交互不够自然,用户难以进行持续的对话交流。助手在处理用户请求时无法中断或接受新输入,导致对话效率低下且体验不佳。此外,用户在对话结束后可能忘记关闭助手,导致不必要的电量消耗。本发明旨在解决这些问题,提升智能助手交互的自然性和效率。

Summary (发明总览):
本发明提出了一种智能眼镜上的人工智能助手交互方法,通过摄像头数据实时感知用户需求并提供帮助。方法包括无需用户主动查询即可启动助手,基于视觉数据识别用户意图,并通过智能眼镜的输出方式提供反馈。此外,本发明还设计了指示灯状态提示、对话中断处理机制以及会话存档功能,提升了交互的自然性和用户体验。

Key Innovation (核心创新):

  1. 基于摄像头数据的智能感知: 通过智能眼镜摄像头实时获取图像数据,人工智能助手无需用户主动查询即可识别用户意图并提供帮助,例如识别用户正在观察的物体并提供相关信息。
  2. 指示灯状态提示: 智能眼镜配备指示灯,通过不同颜色的灯光提示用户助手的工作状态,包括会话启动、监听中以及处理中等状态,提升用户对助手状态的感知。
  3. 对话中断处理机制: 在助手响应用户请求的过程中,如果用户发出新的指令,系统会立即停止当前响应并确认新指令,随后提供更新后的响应,确保对话流畅自然。
  4. 中间响应机制: 在处理用户请求时,助手会先提供一个快速的中间响应(例如简单的确认或初步信息),随后再提供完整的处理结果,减少用户等待时间并提升交互体验。
  5. 会话存档功能: 系统会在会话结束后自动生成会话存档,包括用户输入、图像数据以及助手响应,方便用户回顾或进行后续操作。
  6. 跨设备交互支持: 本发明支持在智能眼镜与其他设备(如智能手表)之间进行交互,例如在智能手表上接收输入指令并在智能眼镜上显示结果,实现多设备协同。
  7. 应用场景与价值: 本发明可应用于日常辅助、导航、信息查询等场景,通过更自然的交互方式提升用户对智能助手的依赖度和满意度,同时优化设备续航表现。

View Full Patent @ WIPO
View Full Patent @ Google Patents



21. 液冷机柜L11工艺

Title (EN): Liquid Cooled Rack L11 Process
Pub. No.: US20260089892

Applicant: Google LLC
Inventor: Madhusudan K. Iyengar, Feini Zhang
Publication Date: 26.03.2026

Abstract:
一种用于计算设备液冷托盘的液冷机柜,包括一个入口集管,其具有用于接收第一温度冷却液的入口和至少一个出口接口,用于将冷却液排放到液冷托盘中;以及一个出口集管,其具有至少一个入口接口,用于接收来自液冷托盘的温度高于第一温度的冷却液,以及一个用于排放冷却液的出口。入口集管或出口集管中的至少一个包括至少一个冷却液排水口,以促进排水和吹扫干燥过程。排水口也可以添加到每个托盘中。通过使用高压空气(干燥和/或加热)、冲洗,可以增强排水和吹扫干燥过程。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
液冷技术领域,具体涉及IT机柜的液冷系统及其运输处理工艺。

Background (发明背景):
传统IT机柜主要采用风冷方式散热,但液冷系统散热效率更高。然而,液冷机柜在运输过程中存在挑战,因为冷却液的存在可能导致运输困难,例如冷却液在寒冷环境下冻结会损坏设备。此外,水基冷却液需要温控运输和储存空间,而水与乙二醇混合液虽然解决了低温冻结问题,但可能带来更高的泵送成本。

Summary (发明总览):
本发明提出了一种液冷机柜系统,通过设计带有冷却液入口和出口集管的机柜结构,并集成多个排水口以便于冷却液的排放和系统维护。该系统支持在运输前后对机柜进行冷却液填充和排空操作,并可通过高压空气或挥发性液体进行吹扫干燥。本发明解决了液冷机柜运输中的冷却液管理问题,提高了系统的灵活性和可靠性。

Key Innovation (核心创新):

  1. 集成了可拆卸的冷却液入口和出口接口设计,通过盲插快速断开接口实现托盘与集管的便捷连接和分离,便于运输和维护。
  2. 在入口集管和出口集管中设置多个冷却液排水口,并可扩展至每个托盘,确保系统内冷却液能够快速彻底排空,避免运输过程中冻结或泄漏风险。
  3. 采用高压干燥空气或加热空气进行系统吹扫干燥,进一步减少冷却液残留,提高运输安全性。
  4. 支持使用挥发性液体对系统进行冲洗,进一步提升清洁度和干燥效果,确保系统在不同环境下稳定运行。
  5. 集管和托盘采用倾斜和/或振动设计辅助冷却液排空,优化排水效率。
  6. 在运输前后对系统进行真空排气处理,确保冷却液填充的稳定性和均匀性。
  7. 本发明适用于需要高效率散热且对运输要求严格的液冷IT设备,可用于数据中心、云计算设施等场景,提供可靠的液冷运输和管理解决方案。

View Full Patent @ WIPO
View Full Patent @ Google Patents



22. 基于用户注视的动态光标显示

Title (EN): DYNAMIC CURSOR DISPLAY BASED ON USER GAZE
Pub. No.: US20260086709

Applicant: GOOGLE LLC
Inventor: Diego Rivas Vetencourt, Dongeek Shin, Ishan Chatterjee
Publication Date: 26.03.2026

Abstract:
本发明提供了一种方法,包括识别用户与设备的注视关联以及用户的手势第一状态。基于注视和手势第一状态,在设备显示上显示光标覆盖内容的第一部分。进一步识别用户手势的第二状态,并基于注视和手势第二状态,在显示上显示光标覆盖内容的第二部分,第二部分与第一部分不同。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
扩展现实(XR)技术; 用户交互界面; 基于注视和手势的输入方法

Background (发明背景):
扩展现实(XR)设备融合了虚拟现实(VR)、增强现实(AR)和混合现实(MR)技术,为用户提供沉浸式体验。然而,现有技术在使用注视和手势进行输入时,存在精度和效率不足的问题。 当前方法难以在用户完成手势前提供精确的输入位置提示,影响交互体验。

Summary (发明总览):
本发明提出了一种基于用户注视和手势状态动态调整光标显示的方法。 通过眼动追踪技术监测用户注视,并结合手势状态(如捏合手势的距离变化)来调整光标大小和位置。 当用户注视特定区域并执行手势时,光标会根据手势状态实时变化,提供更直观的输入反馈。 本发明通过限制向应用提供注视信息,增强了用户隐私保护。

Key Innovation (核心创新):

  1. 结合眼动追踪和手势状态动态调整光标: 通过红外传感器和摄像头监测用户注视,同时利用手势传感器捕捉手势状态(如捏合手势中手指距离),根据这些信息实时调整光标大小和位置。
  2. 光标大小随手势状态变化: 当用户执行捏合手势时,光标大小会根据手指距离变化。例如,手指距离较大时光标较大,随着距离减小,光标逐渐缩小,提供直观的输入位置提示。
  3. 注视焦点与手势结合触发光标位置更新: 设备持续监测用户注视焦点,当注视在特定区域停留超过设定时间阈值时,光标会移动到对应位置,并根据手势状态调整大小。
  4. 精确识别手势完成状态: 设备能够识别手势的完成状态(如捏合手势中手指接触),并在手势完成时将光标位置信息传递给应用,避免应用直接监测用户注视,提高隐私性。
  5. 增强用户隐私保护: 通过限制向应用提供注视信息,仅传递光标位置,设备操作系统承担注视监测和输入位置处理任务,减少用户隐私泄露风险。
  6. 多样化手势支持: 支持多种手势输入方式,包括捏合选择、挥手导航、空中点击等,并通过传感器组合(如摄像头、深度传感器和运动传感器)准确识别手势。
  7. 应用场景与价值: 本发明可应用于XR设备、游戏控制器、智能眼镜等,提供更精准直观的输入方式,尤其在需要精确操作和高隐私保护的场景中具有独特价值,如医疗培训、工业设计和虚拟会议等。

View Full Patent @ WIPO
View Full Patent @ Google Patents



23. 用于在不同显示模式之间切换增强现实(AR)界面的系统状态、配置AR系统的输入和输出设备用户界面以及包含此类特性的方法和AR设备

Title (EN): SYSTEM STATES FOR TRANSITIONING AUGMENTED-REALITY (AR) INTERFACES BETWEEN DIFFERENT DISPLAY MODES, CONFIGURATION USER INTERFACES FOR INPUT AND OUTPUT DEVICES OF AN AR SYSTEM, AND METHODS AND AR DEVICES INCORPORATING SUCH FEATURES
Pub. No.: US20260087754

Applicant: Meta Platforms Technologies, LLC
Inventor: Tushar Arora, Wai Leong Chak, Jonathan Michael Proto
Publication Date: 26.03.2026

Abstract:
一种在AR头显上切换增强现实(AR)用户界面状态的方法。该方法包括:使AR头显在显示的第一部分呈现一个快速浏览用户界面元素。该方法进一步包括:响应于用户的第一请求以显示跟随用户界面元素,使AR头显在显示的第二部分呈现跟随用户界面元素,其中第二部分大于第三部分。该方法进一步包括:响应于用户的第二请求以显示主页用户界面元素,使AR头显在显示的第三部分呈现主页用户界面元素,其中第三部分大于第二部分。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
增强现实(AR)系统用户界面交互技术, 涉及AR头显的显示模式切换和输入输出设备配置。

Background (发明背景):
随着增强现实(AR)头显和智能眼镜等新设备范式的出现,用户需要更直观和吸引人的交互方式以提升使用体验。现有的AR系统可能缺乏对用户初始交互的优化,导致用户难以探索新功能或适应新的交互模式。因此,需要改进AR用户界面的设计以解决这些问题。

Summary (发明总览):
本发明提供了一种在AR头显上切换用户界面状态的方法,通过在不同显示区域呈现不同类型的用户界面元素来优化用户体验。 该方法包括快速浏览、跟随和主页三种用户界面状态,分别在不同的显示区域呈现,以适应用户的不同需求。 此外,本发明还支持多人AR游戏模式,根据用户之间的距离动态调整游戏状态,例如在用户靠近时进行面对面互动,或在距离较远时使用虚拟化身进行互动。 本发明还包括一个AR配置用户界面,用于校准眼动追踪、与其他设备配对、选择输入方法以及显示设备状态。 最后,本发明支持通过手势控制AR头显的功能,包括启动菜单、执行操作、进入睡眠模式和设备配对。

Key Innovation (核心创新):

  1. 实现了多状态用户界面切换技术,通过在AR头显的不同显示区域呈现快速浏览、跟随和主页用户界面元素,使用户能够更直观地访问不同功能。 实现方式:系统根据用户请求动态调整显示区域的大小和内容。 功能:提升用户交互效率,优化信息呈现方式。
  2. 支持多人AR游戏模式,根据用户之间的距离动态调整游戏状态。 实现方式:通过检测用户之间的距离,系统在面对面互动和虚拟化身模式之间切换。 功能:增强多人AR游戏的互动性和沉浸感。
  3. 提供了一个综合的AR配置用户界面,包含眼动追踪校准、设备配对、输入方法选择以及设备状态显示等功能。 实现方式:用户可以通过选择界面中的元素进行各项配置。 功能:简化AR设备的设置过程,提高用户友好性。
  4. 实现了基于手势的AR头显控制技术,支持通过不同的手势启动菜单、执行操作、进入睡眠模式和设备配对。 实现方式:系统识别用户的手势并执行相应的操作。 功能:提供直观的用户交互方式,减少对物理按钮的依赖。
  5. 推测本专利应用于AR头显和智能眼镜等设备中,能够在游戏、教育、培训和日常使用等多种场景中提供更自然和高效的交互体验。 独特价值:通过优化用户界面和交互方式,提升用户对AR技术的接受度和使用频率。

View Full Patent @ WIPO
View Full Patent @ Google Patents



24. 通过视线检测控制功能

Title (EN): CONTROLLING A FUNCTION VIA GAZE DETECTION
Pub. No.: US20260086636

Applicant: Microsoft Technology Licensing, LLC
Inventor: Steven N. BATHICHE, Eric Chris Wolfgang Sommerlade, Vivek PRADEEP
Publication Date: 26.03.2026

Abstract:
本发明涉及使用视线检测来控制计算系统功能的系统和方法。在示例中,接收用户的一个或多个图像,并从接收的图像中确定视线信息。当确定视线信息满足条件时,可接收非视线信息。根据接收的非视线信息,可以启用相应的功能。在示例中,通过从接收的图像中提取多个特征,将这些特征提供给送到神经网络,并利用神经网络确定用户视线在显示设备上的指向位置,从而确定视线信息。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
本发明属于人机交互技术领域,具体涉及基于视线检测的智能控制技术。

Background (发明背景):
现有计算系统在预测用户行为与节省计算资源之间难以平衡。传统方法依赖定时器或图像活动系统(如面部识别)来控制功能,但可能导致误触发或资源浪费。例如,用户无意间出现在摄像头视野中可能导致设备解锁或亮度增加,造成资源浪费和用户体验下降。

Summary (发明总览):
本发明提出了一种基于视线检测来控制计算系统功能的方法。通过分析用户视线信息,系统能够更准确地判断用户意图,从而控制相关功能,如调整屏幕亮度、解锁设备或调用认证系统。与传统方法不同,本发明通过视线检测避免了误触发问题,提高了资源利用效率并增强了用户体验。

Key Innovation (核心创新):

  1. 通过图像传感器获取用户视线信息,利用视线检测判断用户意图。 技术详解:使用图像传感器捕捉用户图像,通过特征提取和神经网络分析确定用户视线方向。 实现方式:提取图像特征并输入神经网络,神经网络输出视线指向位置。 功能:准确判断用户是否有意与设备交互,避免误触发。
  2. 基于视线信息控制设备功能,如调整屏幕亮度或解锁设备。 技术详解:当视线信息满足预设条件时,触发相应功能控制。 实现方式:视线指向与特定界面元素重合时,激活相关功能。 功能:实现更智能的设备控制,提升用户体验。
  3. 结合面部识别系统,通过视线验证用户意图后再进行身份认证。 技术详解:视线检测与面部识别系统协同工作,只有在视线确认用户意图后才进行身份验证。 实现方式:用户视线指向认证界面元素时,触发面部识别流程。 功能:防止误触发身份认证,提高系统安全性。
  4. 视线检测与设备功能深度集成,实现更精细的控制逻辑。 技术详解:视线信息不仅用于触发功能,还用于动态调整设备状态。 实现方式:根据视线方向和停留时间调整设备功能参数。 功能:提供更自然的交互方式,优化用户操作流程。
  5. 降低计算资源消耗,通过视线检测减少不必要的功能调用。 技术详解:仅在视线信息表明用户有意交互时才激活高耗能功能。 实现方式:视线未指向特定区域时,保持低功耗状态。 功能:延长设备续航时间,提升资源利用效率。
  6. 视线检测支持多用户场景,可识别多个用户的视线方向。 技术详解:图像传感器和神经网络算法支持同时处理多用户视线信息。 实现方式:区分不同用户的视线数据并分别处理。 功能:适用于多用户环境,如共享设备或协作场景。
  7. 应用于智能家居、汽车和移动设备等领域,提供更智能的交互体验。 技术详解:将视线检测技术集成到各类智能设备中。 实现方式:根据不同设备需求定制视线检测算法。 功能:提升设备智能化水平,为用户提供更便捷、安全的操作方式。

View Full Patent @ WIPO
View Full Patent @ Google Patents



25. 混合现实头戴设备的传感器锁定功能

Title (EN): SENSOR LOCK FEATURE FOR MIXED REALITY HEADSETS
Pub. No.: US20260087182

Applicant: Meta Platforms Technologies, LLC
Inventor: Andrew Scott Brenner, Andres Bravo, Amit Ranjan Kumar
Publication Date: 26.03.2026

Abstract:
一种实施方式包括在头戴设备处于传感器锁定启用状态时,通过头戴设备的可信软件模块检测用户存在事件。 一种实施方式包括使用头戴设备的可信软件模块,将头戴设备从传感器锁定启用状态切换到传感器锁定禁用状态,该切换包括为头戴设备的隐私敏感传感器供电并打开头戴设备的指示灯。 一种实施方式包括使用头戴设备的可信软件模块,将头戴设备从传感器锁定禁用状态切换回传感器锁定启用状态,该切换包括切断隐私敏感传感器的电源并关闭头戴设备的指示灯。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
混合现实头戴设备技术领域,具体涉及传感器锁定功能。

Background (发明背景):
混合现实(MR)头戴设备通常配备多个传感器,用户可通过手动或自动方式启用或禁用这些传感器。 现有技术存在传感器在用户不知情或未授权的情况下被启用的风险,例如通过恶意软件或误触发用户接近传感器。 这会导致用户隐私泄露或不良体验,因此需要一种能够切断传感器电源的锁定机制。

Summary (发明总览):
本发明提供了一种用于混合现实头戴设备的传感器锁定功能。 其核心思路是当头戴设备处于锁定状态时,通过可信软件模块检测用户存在事件并切换设备状态。 实现路径包括在锁定启用时切断隐私敏感传感器的电源并关闭指示灯,而在锁定禁用时恢复传感器供电并点亮指示灯。 相较于现有技术,本发明通过可信模块控制传感器电源状态,防止未经授权的传感器启用,提升用户隐私保护。 该功能适用于需要高隐私保护级别的MR应用场景,如企业级应用或敏感环境使用。

Key Innovation (核心创新):

  1. 通过可信软件模块控制传感器电源状态,实现传感器锁定功能。 技术详解:使用可信模块在锁定启用时切断隐私敏感传感器电源,禁用状态下恢复供电。 功能:防止传感器在用户不知情时启用,保护用户隐私。
  2. 引入用户存在事件检测机制,智能切换传感器状态。 技术详解:检测用户佩戴或摘下头戴设备等事件,通过传感器或按钮触发状态切换。 功能:确保传感器仅在用户使用设备时启用,提升使用体验。
  3. 采用指示灯作为状态指示,增强用户感知。 技术详解:在传感器锁定状态切换时,通过指示灯提示当前状态。 功能:使用户明确了解传感器当前是否启用,提升设备透明度。
  4. 支持与核心处理组件的通信,实现更复杂的锁定逻辑。 技术详解:通过有线或无线方式与核心处理组件通信,接收锁定状态指令。 功能:支持远程控制或与其他设备协同工作,拓展应用场景。
  5. 区分隐私敏感传感器和非敏感传感器,精细化控制。 技术详解:明确区分不同类型传感器,锁定功能仅针对隐私敏感传感器。 功能:在保护隐私的同时,不影响设备正常使用功能。
  6. 锁定状态切换响应迅速,确保用户体验流畅。 技术详解:采用高效的状态切换机制,缩短切换时间。 功能:避免因锁定功能导致设备响应延迟,提升用户满意度。
  7. 应用于企业级或高隐私需求的MR应用场景。 功能:为企业用户提供更高级别的隐私保护,满足敏感环境使用需求。 独特价值:提升MR设备在隐私保护方面的竞争力,拓展应用领域。

View Full Patent @ WIPO
View Full Patent @ Google Patents



26. 头戴式设备和控制器充电系统

Title (EN): HEADSET AND CONTROLLER CHARGING SYSTEM
Pub. No.: US20260088638

Applicant: Meta Platforms Technologies, LLC
Inventor: Rahul Chabria, Saurabh Mahendra Desai, Richard Andrew Sorensen
Publication Date: 26.03.2026

Abstract:
本发明提供了一种用于为混合现实头戴式设备和相关控制器充电的装置、系统和方法。该充电装置包括一个基座,其具有顶面、侧壁和底面。侧壁连接顶面和底面。底面定义了用于容纳电线的管道结构,该结构包括第一管道部分、第二管道部分和腔体区域。第一管道部分从第一端延伸至腔体区域,第二管道部分从腔体区域延伸至第二端。基座上安装有第一控制器底座和第二控制器底座。基座内的电子电路用于调节充电过程。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
混合现实设备充电技术,具体涉及头戴式设备和控制器的充电系统设计。

Background (发明背景):
混合现实头戴式设备需要具备脱离电源线自主移动的能力,但长时间使用后需要充电。现有的充电设备在空间利用和电线管理方面存在不足,难以同时方便地为头戴式设备和控制器充电。此外,现有技术未充分考虑设备的几何形状、重量分布以及快速拆装的需求。

Summary (发明总览):
本发明提出了一种用于管理电线长度和充电的装置系统。该系统包括一个基座,基座内设计了电线收纳管道结构,并提供两个可调节的控制器充电底座。基座内的电子电路用于智能调节充电过程。本发明通过优化电线收纳和充电底座设计,解决了现有技术中空间利用不足和电线管理不便的问题,同时提升了用户对混合现实设备及其控制器的充电体验。

Key Innovation (核心创新):

  1. 创新的电线收纳管道设计: 技术详解:基座底面设计了包含第一管道部分、第二管道部分和腔体区域的管道结构。 实现方式:通过该结构,电线可以有序地收纳在基座内,避免杂乱。 功能或解决的问题:有效管理电线,提升设备整体整洁度和用户体验。
  2. 可调节的控制器充电底座: 技术详解:两个控制器底座可分别调节并固定在基座上,且底座与基座顶面之间留有空气间隙。 实现方式:通过枢轴连接点,控制器底座可以灵活调整角度。 功能或解决的问题:适应不同尺寸的控制器,提升充电时的稳定性和适配性。
  3. 智能充电电路: 技术详解:基座内集成了电子电路,用于调节充电过程。 实现方式:电路可以监控充电状态并调整充电速率,防止过充。 功能或解决的问题:确保充电安全,延长设备电池寿命。
  4. 优化的空间利用设计: 技术详解:基座顶面和控制器底座之间留有空气间隙,底面设计有管道结构。 实现方式:通过精确的空间规划,实现紧凑而高效的布局。 功能或解决的问题:最大化利用空间,同时保持设备的便携性。
  5. 混合现实设备兼容性: 技术详解:系统设计考虑了混合现实头戴式设备和控制器的充电需求。 实现方式:充电底座和电线收纳结构均针对混合现实设备进行优化。 功能或解决的问题:提供一体化的充电解决方案,提升用户便利性。
  6. 快速拆装机制: 技术详解:控制器底座采用可调节的枢轴连接方式。 实现方式:用户可以快速安装或拆卸控制器,无需额外工具。 功能或解决的问题:简化用户操作,提升设备使用的便捷性。
  7. 推测的应用场景和价值: 技术详解:本发明适用于家庭、办公室或移动办公环境中的混合现实设备充电。 实现方式:通过一体化的设计和智能电路,提供安全便捷的充电体验。 功能或解决的问题:为混合现实设备用户提供可靠的充电解决方案,提升设备使用的整体体验。

View Full Patent @ WIPO
View Full Patent @ Google Patents



27. 用于改善空间音频体验的系统和方法

Title (EN): SYSTEMS AND METHODS FOR IMPROVING SPATIAL AUDIO EXPERIENCE
Pub. No.: US20260089458

Applicant: Meta Platforms Technologies, LLC
Inventor: William Owen Brimijoin, II, Philip Robinson, Michael King
Publication Date: 26.03.2026

Abstract:
在一些实施例中,一种方法包括:由头部跟踪音频系统执行第一算法,用于根据检测到的头部运动动态更新前向头部角度和空间方向,以及执行第二算法,用于根据检测到的头部运动调整重置中心滤波器,并通过执行第一算法和第二算法,使头部跟踪音频系统在检测到的头部运动期间保持空间音频相对于佩戴者的位置。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
本专利涉及空间音频技术,具体为头部跟踪音频系统中的空间音频定位和动态调整技术。

Background (发明背景):
现有的头部跟踪音频系统通常依赖于固定的重置中心函数或静态方向方法,这些方法在保持音频定位方面存在局限性。静态参考框架会导致漂移累积,而固定时间常数的重置中心滤波器无法适应不同幅度的头部运动。这导致现有系统在响应性和稳定性之间存在权衡,难以在各种头部运动中保持空间音频的准确性。

Summary (发明总览):
本发明提出了一种改进的头部跟踪音频系统,通过结合头部牵引(HL)和动态重置中心时间(DRT)两种算法,解决了现有系统在空间音频定位中的不足。该系统能够根据头部运动动态调整音频参考框架和空间音频源的位置,从而在保持音频稳定性的同时避免音频漂移问题。相较于传统方法,本发明在响应性和稳定性之间实现了更好的平衡,提升了用户的沉浸式音频体验。

Key Innovation (核心创新):

  1. 引入头部牵引(HL)算法,通过分析头部运动历史来动态调整前向头部角度和空间音频源的位置,确保音频源相对于用户头部方向保持自然和预期的位置,从而防止音频漂移。
  2. 采用动态重置中心时间(DRT)算法,根据检测到的头部运动幅度调整重置中心滤波器的时间常数,使系统能够适应不同幅度的头部运动,避免固定时间常数带来的不足。
  3. 通过HL和DRT算法的协同工作,系统能够在各种头部运动中保持空间音频的稳定性,减少感知漂移并最小化对空间线索的干扰,提升沉浸式体验。
  4. 系统通过动态更新方向状态,避免了感知上的阻碍或用户不适,解决了传统方法中响应性和稳定性之间的权衡问题。
  5. 实现了对音频源位置的实时动态调整,确保在用户头部运动期间音频源始终保持相对于外部环境的稳定定位,增强了空间音频的真实感。
  6. 该技术可应用于虚拟现实(VR)、增强现实(AR)以及高端耳机系统等场景,为用户提供更自然、更舒适的空间音频体验。
  7. 通过减少音频漂移和提升稳定性,本发明能够有效降低长时间使用时的疲劳感,并提高用户对空间音频内容的沉浸感和满意度。

View Full Patent @ WIPO
View Full Patent @ Google Patents



28. 使用头部位置、视线和空中手势传感器数据定位和控制增强现实眼镜中呈现的增强内容

Title (EN): POSITIONING AND CONTROLLING AUGMENTS PRESENTED WITH AUGMENTED-REALITY GLASSES USING SENSOR DATA INDICATING HEAD POSITION, EYE GAZE, AND IN-AIR HAND GESTURES
Pub. No.: US20260086649

Applicant: Meta Platforms Technologies, LLC
Inventor: Brian John Mc Laughlin, Brandon Malicoat, Paul Martin
Publication Date: 26.03.2026

Abstract:
一种非易失性计算机可读存储介质,包括指令,当由与增强现实头显通信处理器执行时,使处理器执行操作,包括在增强现实头显呈现的增强现实环境中显示增强内容。指令还包括,在接收到识别增强现实头显佩戴者头部运动的信息时,根据佩戴者的头部运动对增强内容在增强现实环境中的位置进行调整,并根据从增强现实头显传感器信息检测到的佩戴者视线来启动选择另一个增强内容。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
本专利涉及扩展现实交互技术,具体是通过多种输入方式(头部运动、视线追踪、手势识别)实现对增强现实环境中虚拟对象的高效控制。

Background (发明背景):
现有扩展现实交互通常依赖单一输入方式,如控制器、视线追踪或动作捕捉。这些方式在复杂交互场景中存在局限性,例如用户需要记忆控制器按钮位置,操作不够直观且学习成本高。本发明旨在解决上述问题,通过结合多种输入方式提升交互的自然性和效率。

Summary (发明总览):
本发明提出了一种基于多模态输入的增强现实交互方案,通过结合头部运动追踪、视线追踪和手势识别,实现对增强现实环境中虚拟对象的直观控制。用户头部运动可调整虚拟对象的位置,视线用于选择目标,手势则触发特定操作。这种多模态交互方式降低了学习成本,提升了交互的自然性和效率。

Key Innovation (核心创新):

  1. 结合头部运动追踪、视线追踪和手势识别三种输入方式,实现对增强现实环境中虚拟对象的全方位控制。 技术实现:通过传感器融合技术,将惯性测量单元(IMU)、SLAM摄像头和手势传感器数据整合处理。 功能:提供更自然和直观的交互方式,减少用户学习成本。
  2. 根据用户头部运动实时调整虚拟对象在增强现实环境中的位置。 技术实现:利用IMU和SLAM摄像头数据计算用户头部姿态变化,并据此调整虚拟对象的位置和视角。 功能:增强沉浸感,使用户能通过自然头部动作控制虚拟对象。
  3. 基于视线追踪实现虚拟对象的选择和切换。 技术实现:通过眼动追踪传感器检测用户视线方向,并结合注视点分析算法确定用户关注的目标。 功能:提供快速且精准的目标选择方式,提升交互效率。
  4. 通过空中手势识别触发特定操作。 技术实现:利用手势传感器捕捉用户手部动作,并通过手势识别算法解析用户意图。 功能:实现无需物理接触的交互方式,增强用户体验。
  5. 多模态输入的协同工作机制。 技术实现:设计输入优先级和冲突解决策略,确保不同输入方式无缝协作。 功能:避免输入冲突,提升交互的流畅性和可靠性。
  6. 增强现实环境中虚拟对象的动态调整策略。 技术实现:根据用户头部运动和视线数据,动态调整虚拟对象的位置、大小和透明度。 功能:提供更符合用户感知习惯的视觉体验,增强沉浸感。
  7. 本专利可应用于游戏、教育、医疗等场景。 独特价值:提供更自然、高效的交互方式,提升用户参与度和操作效率。例如在游戏中,用户可通过头部运动和手势更直观地操控虚拟角色或物体。

View Full Patent @ WIPO
View Full Patent @ Google Patents



29. 文本转语音合成的用户界面自适应方法和系统

Title (EN): METHOD AND SYSTEM FOR USER-INTERFACE ADAPTATION OF TEXT-TO-SPEECH SYNTHESIS
Pub. No.: US20260088013

Applicant: GOOGLE LLC
Inventor: Ajit NARAYANAN
Publication Date: 26.03.2026

Abstract:
本发明公开了一种根据用户界面输入调整语音合成的方法和系统。在使用文本转语音(TTS)系统合成文本段语音并同时在显示设备上显示文本段时,系统可接收跟踪操作输入,跟踪正在合成的文本部分,并识别出已按标准语速合成的文本上下文部分。跟踪信息用于将TTS合成的该部分的语速从标准语速调整为适应语速,并通过应用适应语速和已合成文本上下文的语音特征来调整该部分的合成语音特征。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
本专利涉及文本转语音(TTS)技术领域,具体为基于用户界面输入的语音合成自适应技术。

Background (发明背景):
自动语音识别(ASR)和语音合成技术旨在实现语音与文本之间的准确转换。现有的TTS系统在合成语音时通常采用固定语速,难以根据用户需求调整语音节奏,导致用户体验不佳。此外,现有系统缺乏对上下文语音特征的动态应用,影响了合成语音的自然度。本发明旨在解决这些问题,通过用户界面输入动态调整语音合成参数。

Summary (发明总览):
本发明提供了一种基于用户界面输入的TTS语音合成自适应方法。在用户通过跟踪操作(如鼠标移动或触摸滑动)指示文本段时,系统识别出当前合成的文本部分及其上下文,并基于跟踪操作的运动调整合成语速。同时,系统将上下文部分的语音特征应用到当前部分的合成中,以提升语音的自然度。本发明通过动态调整语速和语音特征,实现了更灵活、更自然的语音合成效果。

Key Innovation (核心创新):

  1. 动态语速调整:通过跟踪操作(如鼠标或触摸输入)的运动轨迹,动态调整TTS合成的语速,实现用户对语音节奏的实时控制。
  2. 上下文语音特征应用:识别并应用已合成文本上下文的语音特征到当前合成部分,确保语音的自然过渡和连贯性。
  3. 实时文本段识别:基于跟踪操作的位置和时间,实时识别当前合成的文本部分及其上下文,确保语速和语音特征的准确应用。
  4. 适应语速计算:根据跟踪操作的运动速度计算适应语速,例如快速移动对应快速语速,慢速移动对应慢速语速。
  5. 用户界面集成:将跟踪操作与显示设备上的文本段显示紧密结合,使用户能够直观地控制语音合成过程。
  6. 语音特征映射:将上下文语音特征映射到当前合成部分的具体参数,如音高、语调和语速变化,确保语音的自然度。
  7. 应用场景推测:本发明可应用于电子书阅读器、语音助手和在线教育平台等场景,为用户提供更灵活、更自然的语音交互体验。

View Full Patent @ WIPO
View Full Patent @ Google Patents



30. 定制化零售环境传感器校准

Title (EN): Customized retail environment sensor calibration
Pub. No.: US12586029

Applicant: Amazon Technologies, Inc.
Inventor: Ofer Meidan, Paul Ignatius Dizon Echevarria, Joohyun Park
Publication Date: 24.03.2026

Abstract:
本发明描述了一种用于校准设施内物品追踪系统中重量传感器位置的技术。该技术包括接收来自设施传感器的重量传感器数据和图像传感器数据。图像传感器数据用于识别事件,并从重量传感器数据中识别相应的数据,以将重量传感器与图像数据中识别的事件位置相关联。该位置可以与重量传感器数据相关联,以便在后续事件和交互中检测和识别物品。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
零售环境物品追踪技术领域,具体涉及重量传感器与图像传感器数据融合的校准方法。

Background (发明背景):
传统实体商店在顾客可接触区域存放库存,顾客可挑选商品并带到收银台结账。然而,现有系统难以准确追踪商品位置和状态,导致库存管理效率低下且易出错。重量传感器虽可检测物品重量变化,但难以精确定位物品位置。本发明旨在解决传感器数据与物品位置关联不准确的问题。

Summary (发明总览):
本发明提出了一种结合图像传感器和重量传感器的校准方法,通过图像数据识别事件并关联重量传感器数据,从而精确定位物品位置。该方法通过分析传感器数据流,将重量变化与具体位置事件对应,提升物品追踪精度。相较于传统方法,本发明实现了传感器数据的智能融合,提高了零售环境中的物品追踪效率和准确性。

Key Innovation (核心创新):

  1. 融合图像传感器与重量传感器数据,通过图像数据识别事件并关联重量传感器数据,实现传感器数据与物品位置的精准匹配。
  2. 采用事件驱动机制,根据图像传感器捕捉的事件(如物品取放)触发重量传感器数据采集和分析,确保数据采集的实时性和准确性。
  3. 通过分析重量传感器数据的时间序列变化,识别物品的取放动作,并结合图像数据确定物品的具体位置,解决了传统方法中传感器数据与位置关联不准确的问题。
  4. 提供了一种动态校准方法,根据实际使用场景自动调整传感器数据与位置的关联关系,适应不同零售环境的需求。
  5. 利用机器学习算法分析传感器数据模式,识别异常事件(如物品丢失或误放),提高零售环境的安全性和管理效率。
  6. 该方法可应用于零售商店、仓库等场景,通过精准的物品追踪和定位,优化库存管理和顾客购物体验。
  7. 通过减少人工干预和错误,本发明能够降低运营成本,提高零售环境的自动化和智能化水平。

View Full Patent @ WIPO
View Full Patent @ Google Patents



31. 调制解调器阵列容错系统

Title (EN): System for modem array fault tolerance
Pub. No.: US12587269

Applicant: AMAZON TECHNOLOGIES, INC.
Inventor: Sharanya Subramanian, Murali Krishnan, Sergii Vystoropskyi
Publication Date: 24.03.2026

Abstract:
卫星上行链路可使用交叉极化干扰消除(XPIC)技术。上行链路可利用两个频率,每个频率均使用XPIC。通过这四种途径传输数据:两个极化和两个频率。卫星上的射频前端硬件检测信号,并为每个频率和极化产生同相(I)和正交(Q)数据。第一组IQ数据由第一对调制解调器处理,第二组IQ数据由第二对调制解调器处理。每对调制解调器处理各自的IQ数据以实现XPIC。第一对调制解调器连接到网络处理器。第二对调制解调器通过第一对调制解调器级联至网络处理器。在第二对调制解调器发生故障时,XPIC停止,之前建立的连接中断。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
卫星通信技术领域,具体涉及调制解调器阵列的容错机制和交叉极化干扰消除技术。

Background (发明背景):
卫星通信系统通常依赖上行链路传输数据,而交叉极化干扰消除(XPIC)技术用于提高信号质量。现有的系统使用多对调制解调器处理不同频率和极化的数据,但当其中一对调制解调器发生故障时,XPIC功能会失效,导致通信质量下降。本发明旨在解决在部分调制解调器故障情况下维持通信连续性的问题。

Summary (发明总览):
本发明提出了一种调制解调器阵列容错系统,通过多对调制解调器处理不同频率和极化的数据,并实现交叉极化干扰消除(XPIC)。当其中一对调制解调器发生故障时,系统能够重新配置连接,确保通信的连续性。该系统通过级联连接和故障检测机制,实现了在部分硬件故障情况下的容错能力。相较于现有技术,本发明在保持XPIC功能的同时,提高了系统的可靠性和通信稳定性。

Key Innovation (核心创新):

  1. 采用双频率和双极化数据传输方案,通过四组独立的IQ数据流实现更高效的上行链路通信。
  2. 使用两对调制解调器分别处理不同频率和极化的IQ数据,每对调制解调器独立实现XPIC功能。
  3. 通过网络处理器和级联连接设计,当第二对调制解调器发生故障时,系统能够重新配置连接,确保通信的连续性。
  4. 在故障情况下,系统能够自动停止XPIC功能并切换到单极化模式,避免通信完全中断。
  5. 通过射频前端硬件的信号检测和数据处理机制,实现对不同频率和极化信号的精确分离和处理。
  6. 该系统适用于高可靠性要求的卫星通信场景,如远程数据传输和应急通信,能够在硬件故障情况下维持基本通信功能。
  7. 通过优化调制解调器连接方式和故障处理机制,本发明在保持通信质量的同时,显著提高了系统的容错能力和可靠性。

View Full Patent @ WIPO
View Full Patent @ Google Patents



32. 带外辅助超宽带感知系统和方法

Title (EN): Systems and methods for out-of-band assisted UWB sensing
Pub. No.: US12585008

Applicant: Meta Platforms Technologies, LLC
Inventor: Carlos Horacio Aldana, Claudio Rafael Cunha Monteiro da Silva, Chunyu Hu
Publication Date: 24.03.2026

Abstract:
一种第一设备包括超宽带(UWB)天线、非UWB通信设备和处理器。处理器配置为通过UWB天线接收来自第二设备的UWB信号,生成与该UWB信号对应的测量报告,并通过非UWB通信设备将测量报告传输给第二设备。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
超宽带感知技术领域,具体涉及带外辅助UWB信号测量和数据传输。

Background (发明背景):
超宽带设备通过在特定时间内发送和接收超宽带信号,可以精确确定环境中物体的位置和/或运动。然而,超宽带信号支持的数据传输速率相对较低,这限制了超宽带设备之间数据交换的速率和大小。现有技术中,超宽带设备的数据传输效率较低,影响了整体感知性能。

Summary (发明总览):
本发明提出了一种带外辅助UWB感知方法,通过第一设备接收UWB信号并生成测量报告,然后利用非UWB通信链路将报告传输给第二设备。该方法通过分离感知和数据传输功能,提高了数据传输效率,同时保持了UWB感知的精度。实现路径包括配置非UWB通信链路用于传输测量报告,以及在设备间协调测量报告的格式和传输协议。

Key Innovation (核心创新):

  1. 通过UWB天线接收反射的UWB信号并生成测量报告,实现对目标物体的精确定位和运动检测。
  2. 利用非UWB通信设备传输测量报告,解决了UWB信号数据传输速率低的问题,提高了整体通信效率。
  3. 在第一设备和第二设备之间配置非UWB通信链路,用于传输UWB信号的测量报告,确保数据传输的可靠性和实时性。
  4. 通过物理层、MAC层管理实体(MLME)和应用层之间的接口设计,实现测量数据从物理层到应用层的有效传递。
  5. 应用层使用来自物理层的测量数据生成测量报告,并通过非UWB通信设备进行传输,优化了数据处理流程。
  6. 支持多种非UWB通信协议,包括无线局域网(WLAN)、蜂窝协议、蓝牙无线协议和非无线协议,增强了系统的灵活性和适用性。
  7. 本发明可应用于智能家居、工业自动化和物联网等领域,通过高效的数据传输和精确的UWB感知,实现对物体位置和运动的精准监测。

View Full Patent @ WIPO
View Full Patent @ Google Patents



33. 执行音频数据中语音检测的设备的电源状态控制

Title (EN): Power state control of a device performing detection of voice in audio data
Pub. No.: US12586583

Applicant: Amazon Technologies, Inc.
Inventor: Narendra Gyanchandani, Bilyana Slavova, Njenga Kariuki
Publication Date: 24.03.2026

Abstract:
本发明描述了一种装置、系统和方法,用于周期性地检测并记录与可穿戴设备相关联或佩戴该设备的用户的语音。该可穿戴设备配置为在低功耗状态和活动状态之间切换设备的各种组件,以确定是否检测到包含语音的音频数据。如果未检测到语音,则组件转换回低功耗状态,从而节省可穿戴设备的电量。如果检测到语音,则收集包含该语音的音频数据以供进一步处理。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
本专利涉及可穿戴设备电源管理技术,具体为语音检测场景下的动态电源状态控制。

Background (发明背景):
随着可穿戴设备的普及,用户对设备续航能力的要求日益提高。现有设备通常配备多种传感器,用于监测用户的心率、血压、运动步数、睡眠质量等指标,但这些设备往往在持续监测过程中消耗大量电量,导致续航时间不足。本发明旨在解决在语音检测过程中如何有效管理设备电源状态的问题。

Summary (发明总览):
本发明提出了一种动态电源管理方案,通过在可穿戴设备中周期性地切换组件的电源状态,实现语音检测时的节能效果。具体实现方式为:设备首先在低功耗状态下进行初步音频检测,若检测到语音信号,则激活相关组件进行进一步处理;否则,保持低功耗状态以节省电量。该方案通过减少不必要的全功率运行时间,显著提升了设备的续航能力。

Key Innovation (核心创新):

  1. 周期性低功耗检测机制:通过在低功耗状态下进行初步音频检测,避免了设备持续全功率运行,从而降低了整体功耗。
  2. 智能状态切换算法:设备根据音频数据中是否包含语音信号,动态切换组件的电源状态,实现精准的电源管理。
  3. 语音信号触发机制:仅在检测到语音信号时激活相关组件进行进一步处理,确保只有在必要时才消耗额外电量。
  4. 音频数据初步筛选:在低功耗状态下对音频数据进行初步筛选,仅对可能包含语音的信号进行详细分析,减少不必要的处理。
  5. 组件级电源控制:针对设备内部不同组件进行独立电源管理,确保只有必要的组件在检测到语音时被激活。
  6. 应用于语音助手和健康监测场景:该技术可应用于语音助手和健康监测设备中,在保证功能的同时显著延长设备续航时间。
  7. 提升用户体验:通过减少设备充电频率和延长使用时间,提升了用户对可穿戴设备的满意度和使用体验。

View Full Patent @ WIPO
View Full Patent @ Google Patents



34. 基于物品图像生成三维模型的系统

Title (EN): Systems for generation of 3D models based on images of items
Pub. No.: US12586314

Applicant: AMAZON TECHNOLOGIES, INC.
Inventor: Meher Gitika Karumuri, Sunil Sharadchandra Hadap
Publication Date: 24.03.2026

Abstract:
本发明通过物品的二维图像生成该物品的三维模型。首先根据物品的类别确定输入图像中包含物品部分的边界框,然后使用分割算法生成包含物品特定像素的掩码。将生成的掩码与构造实体几何算法结合,创建物品的三维模型。该模型用于生成包含物品部分像素的二维图像,每个像素映射到输入图像的对应像素,并将输入图像的颜色和纹理值关联到二维图像的对应像素上。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
本专利属于计算机视觉与三维建模技术领域,具体涉及基于图像生成三维模型的技术。

Background (发明背景):
在线商店和其他类型的用户界面常使用三维模型来展示物品,以便用户查看物品的不同部分或将其与用户身体关联,例如试穿。然而,目前只有有限数量的物品使用三维模型表示,生成这些模型通常需要大量的时间和计算资源,且需要人工干预,容易产生不准确的结果。本发明旨在解决三维模型生成效率低、成本高且易出错的问题。

Summary (发明总览):
本发明提出了一种基于二维图像自动生成物品三维模型的技术方案。其核心思路是:首先识别输入图像中物品的边界框,然后通过分割算法提取物品的像素信息,再结合构造实体几何算法构建三维模型。该方法通过自动化处理减少了人工干预,提高了三维模型生成的效率和准确性。与传统方法相比,本发明能够更快速地生成高质量的三维模型,并适用于多种类型的物品。

Key Innovation (核心创新):

  1. 基于物品类别的边界框识别技术:通过分析输入图像中的物品类别,自动确定包含物品的边界框区域,从而提高分割算法的准确性。
  2. 分割算法生成物品像素掩码:使用先进的图像分割技术,提取物品的精确像素信息,为后续的三维建模提供高质量的输入数据。
  3. 构造实体几何算法与像素数据的结合:将分割得到的像素信息与构造实体几何算法结合,生成精确的三维模型结构。
  4. 像素到像素的映射机制:生成的二维图像中的每个像素都映射到输入图像的对应像素,确保颜色和纹理信息的准确传递。
  5. 自动化处理减少人工干预:通过自动化算法替代传统的人工建模过程,显著提高了三维模型生成的效率并降低了成本。
  6. 多物品类型适用性:技术方案不依赖于特定物品类型,能够处理多种不同类别的物品,扩展了应用范围。
  7. 应用场景推测:该技术可应用于虚拟试衣、在线商品展示和增强现实等领域,为用户提供更真实、直观的购物体验。

View Full Patent @ WIPO
View Full Patent @ Google Patents



35. 用于提高外部量子效率的微量子阱尺寸减小技术

Title (EN): MQW size reduction for improved external quantum efficiency
Pub. No.: US12588345

Applicant: Meta Platforms Technologies, LLC
Inventor: Samir Mezouari, Robert Leslie Breakspear, Andrea Pinos
Publication Date: 24.03.2026

Abstract:
一种光源,包括在其上形成驱动电路的背板、键合到背板的微发光二极管(微LED)阵列,以及位于微LED阵列上的微透镜阵列。每个微LED包括一个台面结构,该结构包含一个p掺杂半导体层、一个n掺杂半导体层、位于p掺杂半导体层和n掺杂半导体层之间的活性区,以及位于p掺杂半导体层或n掺杂半导体层下方并包围活性区的介电层。在某些实施例中,微LED阵列中微LED的活性区中心相对于微LED的台面结构中心和对应的微透镜中心水平偏移。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
本专利涉及微发光二极管(微LED)显示技术,具体涉及通过优化微LED结构设计提高发光效率的技术。

Background (发明背景):
发光二极管(LED)因其尺寸小、耐用性高和效率高等优点,在显示系统中得到广泛应用。微LED基于III-V族半导体材料,具有尺寸小、集成度高和亮度高等特点,适用于高分辨率显示应用。然而,现有微LED技术在发光效率、发光均匀性和制造工艺方面仍存在改进空间。本发明旨在解决这些问题,通过优化微LED的活性区尺寸和位置以及微透镜设计来提高外部量子效率。

Summary (发明总览):
本发明提出了一种改进微LED效率的技术方案,主要通过优化微LED的活性区尺寸和位置以及微透镜设计来实现。具体实现方式包括在背板上键合微LED阵列,并在其上布置微透镜阵列。通过调整活性区相对于台面结构和微透镜的偏移量,以及控制活性区的尺寸和形状,可以有效提高发光效率。此外,本发明还涉及使用分布式布拉格反射器(DBR)层和透明导电层来进一步优化光学性能。

Key Innovation (核心创新):

  1. 通过调整活性区相对于台面结构的水平偏移量,优化光提取效率。 实现方式:设计活性区中心与台面结构中心存在特定偏移量。 功能:提高光从活性区到微透镜的耦合效率,减少光损耗。
  2. 采用非均匀间距的腔体结构,实现活性区尺寸和形状的精确控制。 实现方式:在介电层中蚀刻具有不同尺寸和形状的腔体,并在其中生长活性层。 功能:实现对活性区尺寸和形状的精确控制,优化发光均匀性。
  3. 在微LED周围布置分布式布拉格反射器(DBR)层,增强光反射。 实现方式:在p掺杂或n掺杂半导体层表面沉积多层DBR结构。 功能:提高光提取效率,减少内部反射损耗。
  4. 使用透明导电层和微透镜阵列,进一步优化光学性能。 实现方式:在微LED阵列和微透镜阵列之间沉积透明导电层,并在其上形成微透镜阵列。 功能:提高光提取效率,改善光束准直性。
  5. 通过选择性蚀刻和金属填充工艺,形成具有高导电性的台面结构。 实现方式:蚀刻介电层和半导体层形成台面结构,并在其间填充金属材料。 功能:降低电阻,提高电流注入效率。
  6. 采用过生长掩模层技术,实现对微LED阵列的精确控制。 实现方式:在生长基底上沉积过生长掩模层并图案化,通过掩模层生长半导体结构。 功能:实现对微LED阵列的精确控制,提高集成度。
  7. 本发明可应用于高分辨率显示设备,如AR/VR头显和微型显示器。 独特价值:提供更高亮度、更均匀的发光和更低的功耗,提升显示效果和设备续航能力。

View Full Patent @ WIPO
View Full Patent @ Google Patents



36. 使用毫米波雷达以非接触方式生成呼吸波形用于睡眠阶段估计

Title (EN): Respiration waveform generation for sleep stage estimation in a contactless manner using millimeter wave radar
Pub. No.: US12582350

Applicant: Amazon Technologies, Inc.
Inventor: Durgaprasad Kashinath Shamain, Amit Kachroo, Morris Yuanhsiang Hsu
Publication Date: 24.03.2026

Abstract:
一种用于以非接触方式监测用户睡眠阶段的计算设备,包括处理器、雷达单元和存储器。处理器执行存储器中的指令,使计算设备对从雷达单元接收的波形执行一系列信号处理方法,从而以非接触方式准确确定用户的睡眠阶段。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
本专利涉及非接触式健康监测技术,具体为利用毫米波雷达进行睡眠阶段监测。

Background (发明背景):
传统睡眠监测方法通常需要佩戴设备或传感器,这可能影响用户的睡眠质量。毫米波雷达技术虽然能够进行非接触式监测,但现有系统在准确性和信号处理方面存在不足。本发明旨在解决非接触式睡眠监测中呼吸波形提取和睡眠阶段判断的准确性问题。

Summary (发明总览):
本发明提出了一种利用毫米波雷达进行非接触式睡眠监测的方法。通过分析雷达接收到的呼吸波形,系统能够准确判断用户的睡眠阶段。该方法通过先进的信号处理技术提高了对细微运动的检测能力,从而实现更可靠的睡眠阶段估计。与传统方法相比,本发明无需用户佩戴任何设备,提升了用户体验。

Key Innovation (核心创新):

  1. 采用毫米波雷达技术,通过发射短波长电磁波信号,实现对用户呼吸和身体细微运动的非接触式检测。
  2. 创新性地应用信号处理算法,从雷达回波中提取呼吸波形,并有效滤除环境噪声和无关运动干扰。
  3. 通过分析呼吸波形的频率、幅度和周期性变化,结合机器学习模型,准确判断用户的睡眠阶段。
  4. 系统具备自适应校准功能,能够根据不同用户的身体特征和睡眠习惯进行个性化参数调整,提高监测准确性。
  5. 实现了对微小运动的精确检测,分辨率可达亚毫米级,从而捕捉到更详细的生理信息。
  6. 该技术可应用于智能家居和医疗监护领域,为用户提供全天候、无干扰的睡眠监测服务。
  7. 通过非接触式监测方式,避免了传统设备对用户睡眠的干扰,提升了用户体验和数据采集的连续性。

View Full Patent @ WIPO
View Full Patent @ Google Patents



37. 高长宽比音频换能器的悬挂系统

Title (EN): Suspension system for high-aspect ratio audio transducer
Pub. No.: US12587770

Applicant: Amazon Technologies, Inc.
Inventor: Wei Yang, Alexander Victor Salvatti, Douglas K. Hogue
Publication Date: 24.03.2026

Abstract:
一种音频换能器包括框架和至少部分设置在框架内的悬挂系统。该悬挂系统具有第一轴和第二轴,沿第一轴设置有第一部分和第二部分,沿第二轴设置有第三部分和第四部分。第一部分具有一个或多个第一波纹,第二部分具有一个或多个第二波纹,第三部分具有与第一波纹不同的一个或多个第三波纹,第四部分具有与第一波纹不同的一个或多个第四波纹。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
音频设备领域,具体涉及高长宽比扬声器的悬挂系统设计。

Background (发明背景):
随着电子设备的小型化发展,设备内部空间变得更加紧凑,这对传统扬声器设计提出了挑战。 传统扬声器通常为圆形设计,但在高长宽比应用中难以适配。 现有技术难以在有限空间内实现扬声器的良好性能。 本发明旨在解决高长宽比扬声器悬挂系统的空间利用和性能平衡问题。

Summary (发明总览):
本发明提出了一种适用于高长宽比扬声器的悬挂系统设计,通过在第一轴和第二轴上设置不同波纹结构,优化了悬挂系统的力学性能。 该设计通过在框架内合理分布波纹结构,实现了更高效的振动控制和空间利用。 相较于传统圆形扬声器设计,本发明在高长宽比应用中提供了更优的悬挂解决方案。 该方案通过差异化波纹设计,提升了扬声器的整体性能和稳定性。

Key Innovation (核心创新):

  1. 采用双轴悬挂结构,通过在第一轴和第二轴上分别设置不同波纹结构,实现对扬声器振动的精确控制。
  2. 第一部分和第二部分沿第一轴设置,通过差异化波纹设计,优化了悬挂系统的纵向力学性能。
  3. 第三部分和第四部分沿第二轴设置,通过不同波纹结构的设计,提升了悬挂系统的横向稳定性。
  4. 通过差异化波纹设计,实现了悬挂系统在不同方向上的弹性调节,适应高长宽比扬声器的特殊需求。
  5. 悬挂系统与框架的配合设计,确保了扬声器在紧凑空间内的可靠安装和高效振动控制。
  6. 该设计通过优化悬挂系统的力学特性,提升了扬声器的音质表现和耐用性。
  7. 本发明特别适用于智能家居设备、电视等空间受限的音频应用场景,提供了紧凑型扬声器的悬挂解决方案。

View Full Patent @ WIPO
View Full Patent @ Google Patents



38. 全球导航卫星系统故障期间移动用户终端的操作

Title (EN): Mobile customer terminals (CTs) operation in an global navigation satellite system (GNSS) outage
Pub. No.: US12585028

Applicant: Amazon Technologies, Inc.
Inventor: Marcos Bruno Saldanha Tavares, Aditya Chopra, Arunabha Ghosh
Publication Date: 24.03.2026

Abstract:
本专利描述了在全球导航卫星系统(GNSS)故障期间,用户终端(CT)与卫星网络中的卫星(SAT)建立并维持通信链路的技术。一种方法包括使用CT的位置和速度信息建立通信链路。该方法在第一时刻接收来自GNSS的第一时间信息,并相应地更新CT的第一时钟。该方法在第一时间之后的第二时刻确定第二时间信息,该时间信息表示CT的第一时钟与SAT的第二时钟之间的时钟漂移。第二时间信息是通过在第二时刻之前CT与SAT之间交换的消息获得的。该方法使用第二时间信息进行更新。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
卫星通信技术领域,具体涉及GNSS故障期间的用户终端定位与时间同步技术。

Background (发明背景):
随着数字媒体消费的增长,用户越来越多地使用各种电子设备访问内容。这些设备依赖无线通信基础设施进行数据传输。现有技术中,GNSS被广泛用于设备定位和时间同步,但在GNSS故障情况下,设备可能无法正常工作。这会导致通信中断或数据同步问题,影响用户体验。

Summary (发明总览):
本发明提出了一种在GNSS故障期间维持用户终端与卫星通信的方法。其核心思路是利用设备的位置和速度信息,以及设备与卫星之间交换的消息来估算时间漂移,从而实现时间同步。该方法通过在GNSS不可用时依赖设备自身的定位能力和卫星通信数据来维持通信链路,相较于传统依赖GNSS的方案,在GNSS故障情况下提供了更可靠的通信保障。

Key Innovation (核心创新):

  1. 通过设备的位置和速度信息建立通信链路,避免对GNSS的依赖。 实现方式:利用设备内置的定位传感器和运动传感器数据,结合卫星通信协议。 功能:确保在GNSS故障期间仍能建立和维持通信链路。
  2. 通过设备与卫星之间交换的消息估算时钟漂移。 实现方式:分析GNSS故障前后的通信数据,计算时间差并补偿时钟漂移。 功能:实现设备与卫星之间的时间同步,确保数据准确传输。
  3. 在GNSS故障期间动态更新设备时钟。 实现方式:基于估算的时钟漂移值,动态调整设备内部时钟。 功能:维持设备与卫星网络的时间一致性,避免通信中断。
  4. 采用双向通信协议进行时间信息交换。 实现方式:利用卫星与设备之间的双向消息传递机制,交换时间同步数据。 功能:提高时间同步的精度和可靠性。
  5. 在GNSS故障期间优化通信链路参数。 实现方式:根据设备位置和卫星信号强度动态调整通信参数,如功率和频率。 功能:确保在GNSS故障期间通信链路的稳定性和效率。
  6. 设备内置备用定位算法以应对GNSS故障。 实现方式:集成基于惯性导航或环境感知的定位算法作为GNSS的补充。 功能:提供GNSS故障时的持续定位能力。
  7. 本发明可应用于需要高可靠性的卫星通信场景,如紧急救援、军事通信等。 独特价值:在GNSS不可用的情况下提供持续可靠的通信服务,提升系统的鲁棒性和可用性。

View Full Patent @ WIPO
View Full Patent @ Google Patents



39. 基于电压感测的家电能耗估算

Title (EN): Appliance energy estimation based on voltage sensing
Pub. No.: US12584949

Applicant: Amazon Technologies, Inc.
Inventor: Henning Lange, Krzysztof Marcin Walczak, Naveen Ramakrishnan
Publication Date: 24.03.2026

Abstract:
本发明描述了系统、方法和装置,通过在住宅或建筑物内任意标准电源插座处感测电压信号来确定家电的能耗,而无需对电路进行电流测量。通过电源插座处的电压测量,可以确定从供电变压器到建筑物配电盘的供电线路电阻。同样,电源插座处的电压测量可用于确定配电盘的输入电压。配电盘的输入电压和线路电阻可用于确定在该位置运行的家电的电流。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
家电能耗监测领域; 非侵入式电压感测技术; 基于电压信号的电能计算。

Background (发明背景):
家电监测主要分为侵入式和非侵入式两种方法。侵入式方法通过在电器电源线上安装电流传感器实现高精度监测,但成本高且难以推广。非侵入式方法依赖单点测量,通常使用低频电流和电压数据,但现有系统需要电工安装新的测量设备,增加了实施难度。本发明旨在提供一种无需额外设备安装且成本更低的非侵入式监测方案。

Summary (发明总览):
本发明提出了一种基于电压感测的家电能耗估算方法,通过测量标准电源插座处的电压信号来估算家电的能耗。其核心思路是利用电压信号计算供电线路电阻和配电盘输入电压,进而推导出家电的运行电流。本发明无需在电路中安装额外设备,降低了实施成本和复杂性,同时保持了较高的监测精度。

Key Innovation (核心创新):

  1. 通过电压测量计算供电线路电阻: 技术详解:利用电源插座处的电压数据,结合供电变压器和配电盘的位置信息,计算供电线路的电阻。 实现方式:通过电压降与电流的关系公式进行计算。 功能或解决的问题:无需额外设备即可获得线路电阻数据,降低了监测成本。
  2. 配电盘输入电压的估算方法: 技术详解:通过电源插座处的电压测量值,结合线路电阻,推导配电盘的输入电压。 实现方式:应用电压分配原理和电路模型进行计算。 功能或解决的问题:提供了配电盘电压的估算方法,为后续电流计算奠定基础。
  3. 基于电压和电阻的电流计算: 技术详解:利用配电盘输入电压和线路电阻,根据欧姆定律计算家电的运行电流。 实现方式:应用电流计算公式,结合电压和电阻数据。 功能或解决的问题:实现了非侵入式电流估算,无需电流传感器即可监测家电能耗。
  4. 无需额外设备安装的实施方式: 技术详解:仅需在现有电源插座处进行电压测量,无需对电路进行任何改动。 实现方式:使用便携式电压测量设备或内置电压传感器。 功能或解决的问题:降低了实施难度和成本,提高了监测系统的可推广性。
  5. 适用于多种家电的通用监测方案: 技术详解:无需针对不同家电进行定制化设计,可监测所有连接在电路上的电器。 实现方式:基于电压和电流的通用计算模型。 功能或解决的问题:提供了一种通用的家电能耗监测方案,适用范围广。
  6. 提高监测精度的数据处理方法: 技术详解:通过多次电压测量和滤波算法,提高电压数据的准确性和稳定性。 实现方式:应用信号处理技术,如均值滤波和去噪算法。 功能或解决的问题:减少了测量误差,提高了电流估算的精度。
  7. 应用于智能家居和能耗管理: 技术详解:将监测数据与智能家居系统集成,实现家电能耗的实时监控和管理。 实现方式:通过无线通信模块将电压数据上传至云端或本地服务器。 功能或解决的问题:提供了一种智能化的能耗管理方案,帮助用户优化用电行为,降低能耗。

View Full Patent @ WIPO
View Full Patent @ Google Patents



40. 基于设备参数的声音输出

Title (EN): Audio output based on device parameters
Pub. No.: US12587401

Applicant: Amazon Technologies, Inc.
Inventor: Andrew David Cross, Gerard Guy Medioni, Saurabh Gupta
Publication Date: 24.03.2026

Abstract:
本发明提供了一种系统和方法,用于根据一个或多个计算设备的设备参数输出音频数据。该系统可以获取与一个或多个第一计算设备相关联的音频数据,并根据这些设备位于第一位置来同步音频数据。系统可以确定与同步音频数据相关联的实体。基于音频数据的同步和实体的确定,系统可以将同步音频数据及实体的标识符路由到媒体管理系统,以便在第二计算设备位于第二位置时进行传输。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
音频处理技术领域,具体涉及基于设备位置和参数的声音同步与路由。

Background (发明背景):
现有的会议系统(如视频会议系统)允许实体通过网络实时通信。这些系统通常从传感器获取图像数据和音频数据,处理数据生成输出,并将相同的输出传输到连接设备。然而,当多个设备位于同一位置时,这种数据获取和输出方式会浪费资源并影响用户体验。此外,在通信初始化前,系统通常需要获取凭证(如用户名和密码)进行登录,这既耗时又低效。

Summary (发明总览):
本发明提出了一种基于设备位置和参数的声音输出方案。其核心思路是根据设备位置同步音频数据,并识别相关实体,然后根据目标设备的位置将处理后的音频数据定向传输。实现路径包括:获取音频数据、基于位置同步数据、识别实体并路由数据。本发明相较于现有技术的主要改进在于避免了重复传输相同数据,优化了资源利用,并简化了通信初始化过程。

Key Innovation (核心创新):

  1. 基于设备位置同步音频数据:通过检测设备位置,将来自同一位置的音频数据进行同步处理,确保声音输出的空间一致性。
  2. 实体识别与音频数据关联:系统能够识别与音频数据相关的实体,并将其标识符与音频数据绑定,以便在目标设备上进行定向传输。
  3. 动态音频数据的定向路由:系统根据目标设备的位置,将同步后的音频数据和实体标识符路由到媒体管理系统,实现精准传输。
  4. 资源优化:通过避免向同一位置的多个设备重复传输相同音频数据,减少了带宽和计算资源的浪费。
  5. 简化通信初始化:无需繁琐的凭证登录过程,系统能够基于设备位置和参数自动识别并连接相关设备,提升了用户体验。
  6. 适用于多设备协同场景:本发明特别适用于会议室、展览厅等需要多设备协同工作的场景,能够有效管理音频数据的传输和输出。
  7. 提升音频体验:通过精准的音频数据同步和定向传输,本发明能够提供更清晰、更具空间感的音频体验,特别是在多人会议或协作环境中。

View Full Patent @ WIPO
View Full Patent @ Google Patents



41. 语音交互的用户反馈

Title (EN): User feedback for speech interactions
Pub. No.: US12586564

Applicant: Amazon Technologies, Inc.
Inventor: Gilles Jean Roger Belin, Charles S. Rogers, III, Robert David Owen
Publication Date: 24.03.2026

Abstract:
一种交互系统可以通过位于用户环境中的音频设备实现,该设备可以接受用户的语音命令,并通过生成的语音与用户进行交互。为了提高交互系统的性能,用户可以使用单独的设备(如个人电脑或移动设备)访问图形用户界面,该界面列出了历史语音交互的详细信息。图形用户界面被配置为允许用户对特定交互的详细信息提供反馈和/或更正。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
语音交互技术领域,具体涉及语音识别、语音生成和用户反馈机制。

Background (发明背景):
语音交互已成为人机交互的重要方式,但其错误率高于其他交互方式,如机械输入、触摸屏等。语音识别和理解中的错误,以及语音生成中的不准确问题,限制了语音交互的可靠性。现有的语音交互系统缺乏有效的用户反馈机制来改进其性能。

Summary (发明总览):
本发明提出了一种通过用户反馈改进语音交互系统性能的方法。用户可以通过图形用户界面查看历史语音交互的详细信息,并提供反馈或更正。这些反馈被用于优化语音识别和生成过程,从而提高系统的整体准确性。本发明通过引入用户参与机制,弥补了现有语音交互系统在错误修正和性能优化方面的不足。

Key Innovation (核心创新):

  1. 图形用户界面用于展示历史语音交互的详细信息,用户可以查看具体交互内容。 实现方式:通过与音频设备连接的独立设备(如电脑或手机)访问界面。 功能:使用户能够直观地了解语音交互的历史记录。
  2. 用户可以通过图形用户界面对特定语音交互提供反馈和更正。 实现方式:界面提供输入框或选项,允许用户提交更正内容和反馈意见。 功能:收集用户对语音识别和生成结果的直接意见。
  3. 系统利用用户反馈优化语音识别和生成模型。 实现方式:将用户反馈数据输入到机器学习算法中,用于调整模型参数。 功能:提高语音识别的准确性和语音生成的自然度。
  4. 独立设备作为用户反馈的入口,确保反馈过程的便捷性和独立性。 实现方式:使用手机或电脑等常用设备,避免对音频设备的依赖。 功能:使用户能够随时随地进行反馈操作。
  5. 反馈数据被分类和标记,用于系统性能的持续改进。 实现方式:通过自然语言处理技术对反馈内容进行分类和分析。 功能:系统能够识别常见错误类型并优先改进。
  6. 语音交互系统能够根据用户反馈动态调整交互策略。 实现方式:基于用户反馈调整语音识别和生成的参数设置。 功能:提高系统在复杂环境下的适应性和鲁棒性。
  7. 本发明可应用于智能家居、虚拟助手等场景,提升用户体验。 独特价值:通过用户反馈机制,显著减少语音交互中的错误,提高用户满意度。

View Full Patent @ WIPO
View Full Patent @ Google Patents



42. 语音浏览对话中的音调和文本选择

Title (EN): Selecting tones and text of voice browsing conversations
Pub. No.: US12586584

Applicant: Amazon Technologies, Inc.
Inventor: Edward Bueche, Amaury Gutierrez Acosta, Francois Mairesse
Publication Date: 24.03.2026

Abstract:
通过训练模型选择对话行为(例如问题),以识别最有可能达成预期结果的行为。在接收到开始对话的调用时,确定一个表示对话成功可能性的置信度分数,并根据该分数选择对话行为。在对话的每个回合中,更新分数或计算新分数,并根据更新或新的分数选择对话行为。置信度分数基于输入特征计算,这些特征由发起调用的用户或对对话行为的响应以及对话的上下文确定,并作为输入提供给线性模型或机器学习模型。

Patent Drawings:

Patent Drawing

Technical Field (技术领域):
语音交互技术领域,具体涉及语音浏览对话中的对话行为选择和置信度评估。

Background (发明背景):
语音浏览通过语音与计算机系统进行交互,但现有系统难以识别用户情绪或对话成功可能性。大多数系统无法根据用户情绪或对话目标选择合适的对话行为或语气,这可能导致用户放弃目标或体验不佳。

Summary (发明总览):
本发明通过训练模型选择对话行为来提高语音浏览体验的质量。系统根据用户输入和对话上下文计算置信度分数,并基于该分数选择最合适的对话行为。在对话过程中,模型持续更新分数并调整行为选择,以优化对话的进展和成功率。这种方法能够更准确地评估对话状态并选择合适的交互方式,从而提高用户满意度。

Key Innovation (核心创新):

  1. 通过训练模型选择对话行为,识别最有可能达成预期结果的行为。 实现方式:使用机器学习模型分析用户输入和对话上下文。 功能或解决的问题:提高对话行为的准确性,避免用户因不合适的交互而放弃目标。
  2. 在对话开始时计算置信度分数,评估对话成功的可能性。 实现方式:基于用户调用的特征和对话上下文计算分数。 功能或解决的问题:帮助系统判断是否需要调整策略以提高成功率。
  3. 在对话的每个回合中更新或重新计算置信度分数。 实现方式:实时分析用户响应和对话进展。 功能或解决的问题:确保系统能够动态调整策略以适应对话的变化。
  4. 基于用户输入和对话上下文计算置信度分数。 实现方式:提取用户特征和对话特征作为模型输入。 功能或解决的问题:提高分数计算的准确性和对话行为的针对性。
  5. 使用线性模型或机器学习模型处理输入特征。 实现方式:训练模型以识别影响对话成功的关键因素。 功能或解决的问题:增强系统对复杂对话场景的处理能力。
  6. 根据置信度分数选择合适的对话行为或语气。 实现方式:建立分数与对话行为之间的映射关系。 功能或解决的问题:确保系统能够根据对话状态选择最合适的交互方式。
  7. 应用于语音浏览系统,提供更智能和个性化的用户体验。 实现方式:集成到现有的语音交互流程中。 功能或解决的问题:提高用户满意度,减少因对话不畅导致的目标放弃。

View Full Patent @ WIPO
View Full Patent @ Google Patents


Total Patents: 42
Last Updated: 20260330


The Patent Scoop Trio