type
status
date
slug
summary
tags
category
icon
password

OmniParser 2 Windows安装指南(AMD/Nvidia平台)

📝 前置条件

  1. 安装 Python 3.12
  1. 安装 Anaconda(官网可直接exe安装。因此可以无视这步。)
    1. 或使用命令
      ▸ 添加环境变量:C:\\Users\\你的用户名\\anaconda3\\condabin

🛠️ 安装步骤

  1. 克隆项目
    1. 创建conda环境
      1. 下载视觉模型
        1. 修改模型路径
          1. gradio_demo.py中将florence2模型路径改为:
        1. 启动演示
          1. Tips: 部分用户可能无法使用gradio_demo.py,请使用项目根目录另一个jupyter笔记本文件ipynb运行。

        ⚠️ 注意事项

        • 确保已安装CUDA驱动(未安装则默认使用CPU)
        • AMD显卡需确认ROCm环境配置
        • 如遇路径错误,建议使用绝对路径
        • 建议通过conda单独安装PyTorch:

          Doiiars汇总文档与原文档差异说明

          1. 移除了冗余的clean命令(实测安装过程无需清理)
          1. 补充了AMD显卡的注意事项
          1. 添加了PyTorch独立安装建议
          1. 优化了路径说明,避免环境变量错误
          1. 完善了Anaconda的安装方法
          遇到问题可优先检查: 10. conda环境是否激活 11. CUDA/cuDNN版本兼容性 12. 模型文件是否完整下载(约3.5GB)

          维护者 Doiiars 的交流群:

          交流反馈QQ群:491708665 一键加群
          相关文章
          最全免费 ASR 服务合集!(阿里云系列模型)
          Lazy loaded image
          Due to unexpected capacity constraints, Claude is unable to respond to your message. Please try again soon. 解决方案
          Lazy loaded image
          koishi部署教程[Linux]
          Lazy loaded image
          GitHub to Gitingest 按钮
          Lazy loaded image
          电脑开机没网?90%是代理软件惹的祸
          Lazy loaded image
          Windows屏幕分辨率和DPI调整神器:SetRes和SetDPI详细教程
          Lazy loaded image
          GitHub to Gitingest 按钮Follow认证
          Loading...
          Doiiars
          Doiiars
          一个低调的技术Geek
          最新发布
          最全免费 ASR 服务合集!(阿里云系列模型)
          2025-3-28
          大模型基准测试的详细介绍
          2025-3-28
          Ollama 中 Gemma3 的 Function Calling 无法使用的问题
          2025-3-28
          自定义 Modelfile 方案实现 Ollama Gemma 3 函数调用指南
          2025-3-28
          Ollama 版本 Gemma 3 缺少函数调用的解决方案
          2025-3-28
          DeepSeek-V3-0324更新了什么?
          2025-3-27