首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

C# OpenCvSharp DNN 实现百度网盘AI大赛-表格检测第2名方案第三部分-表格方向识别

  • 25-02-19 03:42
  • 2673
  • 12720
blog.csdn.net

目录

说明

效果

模型

项目

​编辑

代码

参考

下载

其他


说明

百度网盘AI大赛-表格检测的第2名方案。

该算法包含表格边界框检测、表格分割和表格方向识别三个部分,首先,ppyoloe-plus-x 对边界框进行预测,并对置信度较高的表格边界框(box)进行裁剪。裁剪后的单个表格实例会送入到DBNet中进行语义分割,分割结果通过opencv轮廓处理获得表格关键点(point)。之后,我们根据DBNet计算的关键点在裁剪后的单个表格实例上绘制表格边界。最后,PP-LCNet结合表格边界先验和表格实例图像,对表格的方向进行预测,并根据之前定义的几何轮廓点与语义轮廓点的对应关系,将几何轮廓点映射为语义轮廓点。

本文使用C# OpenCvSharp DNN 实现百度网盘AI大赛-表格检测第2名方案第三部分-表格方向识别

效果

模型

Model Properties
-------------------------
---------------------------------------------------------------

Inputs
-------------------------
name:input
tensor:Float[-1, 3, 624, 624]
---------------------------------------------------------------

Outputs
-------------------------
name:linear_1.tmp_1
tensor:Float[-1, 4]
---------------------------------------------------------------

项目

代码

using OpenCvSharp;
using OpenCvSharp.Dnn;
using System;
using System.Drawing;
using System.Linq;
using System.Windows.Forms;

namespace OpenCvSharp_DNN_Demo
{
    public partial class frmMain : Form
    {
        public frmMain()
        {
            InitializeComponent();
        }

        string fileFilter = "*.*|*.bmp;*.jpg;*.jpeg;*.tiff;*.tiff;*.png";
        string image_path = "";
        string startupPath;
        string classer_path;

        DateTime dt1 = DateTime.Now;
        DateTime dt2 = DateTime.Now;
        string model_path;
        Mat image;

        Mat result_mat;
        Mat result_image;
        Mat result_mat_to_float;

        Net opencv_net;
        Mat BN_image;

        float[] result_array;

        int max_image_length;
        Mat max_image;
        Rect roi;

        private void button1_Click(object sender, EventArgs e)
        {
            OpenFileDialog ofd = new OpenFileDialog();
            ofd.Filter = fileFilter;
            if (ofd.ShowDialog() != DialogResult.OK) return;

            pictureBox1.Image = null;
            pictureBox2.Image = null;
            textBox1.Text = "";

            image_path = ofd.FileName;
            pictureBox1.Image = new Bitmap(image_path);
            image = new Mat(image_path);
        }

        private void Form1_Load(object sender, EventArgs e)
        {
            string model_path = "model/paddle_cls.onnx";
            opencv_net = CvDnn.ReadNetFromOnnx(model_path);

            image_path = "test_img/1.jpg";
            pictureBox1.Image = new Bitmap(image_path);

        }

        private unsafe void button2_Click(object sender, EventArgs e)
        {
        
            if (image_path == "")
            {
                return;
            }

            if (image_path == "")
            {
                return;
            }
            textBox1.Text = "检测中,请稍等……";
            pictureBox2.Image = null;
            Application.DoEvents();

            Mat image = new Mat(image_path);

            //缩放图片
            max_image_length = image.Cols > image.Rows ? image.Cols : image.Rows;
            max_image = Mat.Zeros(new OpenCvSharp.Size(max_image_length, max_image_length), MatType.CV_8UC3);
            roi = new Rect(0, 0, image.Cols, image.Rows);
            image.CopyTo(new Mat(max_image, roi));

            //数据归一化处理
            BN_image = CvDnn.BlobFromImage(max_image, 1 / 255.0, new OpenCvSharp.Size(624, 624), new Scalar(0, 0, 0), true, false);

            //配置图片输入数据
            opencv_net.SetInput(BN_image);

            dt1 = DateTime.Now;
            //模型推理,读取推理结果
            result_mat = opencv_net.Forward();
            dt2 = DateTime.Now;

            //将推理结果转为float数据类型
            result_mat_to_float = new Mat(1, 4, MatType.CV_32F, result_mat.Data);

            //将数据读取到数组中
            result_mat_to_float.GetArray(out result_array);

            float max = result_array.Max(); // 
            int maxIndex = Array.IndexOf(result_array, max); // 获取最大值的索引位置
            //语义左上角位于几何左上角,定义为0;
            //语义左上角位于几何右上角,定义为1;
            //语义左上角位于几何右下角,定义了2;
            //语义左上角位于几何左下角,定义为3。
            
            textBox1.Text = "推理耗时:" + (dt2 - dt1).TotalMilliseconds + "ms\r\n";
            string msg = "";
            if (maxIndex == 0) {
                msg = "语义左上角位于几何左上角";
            }
            else if (maxIndex == 1)
            {
                msg = "语义左上角位于几何右上角";
            }
            else if (maxIndex == 2)
            {
                msg = "语义左上角位于几何右下角";
            }
            else if (maxIndex == 3)
            {
                msg = "语义左上角位于几何左下角";
            }
            textBox1.Text += "\r\n" + msg;
        }

        private void pictureBox2_DoubleClick(object sender, EventArgs e)
        {
            Common.ShowNormalImg(pictureBox2.Image);
        }
        
        private void pictureBox1_DoubleClick(object sender, EventArgs e)
        {
            Common.ShowNormalImg(pictureBox1.Image);
        }
    }
}
 

  1. using OpenCvSharp;
  2. using OpenCvSharp.Dnn;
  3. using System;
  4. using System.Drawing;
  5. using System.Linq;
  6. using System.Windows.Forms;
  7. namespace OpenCvSharp_DNN_Demo
  8. {
  9. public partial class frmMain : Form
  10. {
  11. public frmMain()
  12. {
  13. InitializeComponent();
  14. }
  15. string fileFilter = "*.*|*.bmp;*.jpg;*.jpeg;*.tiff;*.tiff;*.png";
  16. string image_path = "";
  17. string startupPath;
  18. string classer_path;
  19. DateTime dt1 = DateTime.Now;
  20. DateTime dt2 = DateTime.Now;
  21. string model_path;
  22. Mat image;
  23. Mat result_mat;
  24. Mat result_image;
  25. Mat result_mat_to_float;
  26. Net opencv_net;
  27. Mat BN_image;
  28. float[] result_array;
  29. int max_image_length;
  30. Mat max_image;
  31. Rect roi;
  32. private void button1_Click(object sender, EventArgs e)
  33. {
  34. OpenFileDialog ofd = new OpenFileDialog();
  35. ofd.Filter = fileFilter;
  36. if (ofd.ShowDialog() != DialogResult.OK) return;
  37. pictureBox1.Image = null;
  38. pictureBox2.Image = null;
  39. textBox1.Text = "";
  40. image_path = ofd.FileName;
  41. pictureBox1.Image = new Bitmap(image_path);
  42. image = new Mat(image_path);
  43. }
  44. private void Form1_Load(object sender, EventArgs e)
  45. {
  46. string model_path = "model/paddle_cls.onnx";
  47. opencv_net = CvDnn.ReadNetFromOnnx(model_path);
  48. image_path = "test_img/1.jpg";
  49. pictureBox1.Image = new Bitmap(image_path);
  50. }
  51. private unsafe void button2_Click(object sender, EventArgs e)
  52. {
  53. if (image_path == "")
  54. {
  55. return;
  56. }
  57. if (image_path == "")
  58. {
  59. return;
  60. }
  61. textBox1.Text = "检测中,请稍等……";
  62. pictureBox2.Image = null;
  63. Application.DoEvents();
  64. Mat image = new Mat(image_path);
  65. //缩放图片
  66. max_image_length = image.Cols > image.Rows ? image.Cols : image.Rows;
  67. max_image = Mat.Zeros(new OpenCvSharp.Size(max_image_length, max_image_length), MatType.CV_8UC3);
  68. roi = new Rect(0, 0, image.Cols, image.Rows);
  69. image.CopyTo(new Mat(max_image, roi));
  70. //数据归一化处理
  71. BN_image = CvDnn.BlobFromImage(max_image, 1 / 255.0, new OpenCvSharp.Size(624, 624), new Scalar(0, 0, 0), true, false);
  72. //配置图片输入数据
  73. opencv_net.SetInput(BN_image);
  74. dt1 = DateTime.Now;
  75. //模型推理,读取推理结果
  76. result_mat = opencv_net.Forward();
  77. dt2 = DateTime.Now;
  78. //将推理结果转为float数据类型
  79. result_mat_to_float = new Mat(1, 4, MatType.CV_32F, result_mat.Data);
  80. //将数据读取到数组中
  81. result_mat_to_float.GetArray<float>(out result_array);
  82. float max = result_array.Max(); //
  83. int maxIndex = Array.IndexOf(result_array, max); // 获取最大值的索引位置
  84. //语义左上角位于几何左上角,定义为0;
  85. //语义左上角位于几何右上角,定义为1;
  86. //语义左上角位于几何右下角,定义了2;
  87. //语义左上角位于几何左下角,定义为3。
  88. textBox1.Text = "推理耗时:" + (dt2 - dt1).TotalMilliseconds + "ms\r\n";
  89. string msg = "";
  90. if (maxIndex == 0) {
  91. msg = "语义左上角位于几何左上角";
  92. }
  93. else if (maxIndex == 1)
  94. {
  95. msg = "语义左上角位于几何右上角";
  96. }
  97. else if (maxIndex == 2)
  98. {
  99. msg = "语义左上角位于几何右下角";
  100. }
  101. else if (maxIndex == 3)
  102. {
  103. msg = "语义左上角位于几何左下角";
  104. }
  105. textBox1.Text += "\r\n" + msg;
  106. }
  107. private void pictureBox2_DoubleClick(object sender, EventArgs e)
  108. {
  109. Common.ShowNormalImg(pictureBox2.Image);
  110. }
  111. private void pictureBox1_DoubleClick(object sender, EventArgs e)
  112. {
  113. Common.ShowNormalImg(pictureBox1.Image);
  114. }
  115. }
  116. }

参考

https://github.com/hpc203/TableDetection

下载

源码下载

其他

C# OpenCvSharp DNN 第一部分-表格边界框检测-CSDN博客

C# OnnxRuntime 第二部分-表格分割-CSDN博客

天天代码码天天
微信公众号
.NET 人工智能实践
注:本文转载自blog.csdn.net的天天代码码天天的文章"https://lw112190.blog.csdn.net/article/details/144488366"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2492) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

101
推荐
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2025 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top