Tensorflow 学习之Google Object Detection api 的学习(二)检测自己的图片_qq_15205173的博客-程序员秘密

环境 :win10 + tensorflow
前期准备:完成object detection api 的配置 环境配置
(一)图片准备
下载labelimg 有很多种方法这里 列出几种
1.去github 上下载附上链接 https://github.com/tzutalin/labelImg/releases
labelimg下载
下载后直接解压运行labelimg.exe
2.有pycharm 的同学直接“File”-“setting”-“project interpreter”-点击“+”号在这里插入图片描述
输入框中输入 “labelimg”![在这里插入图片描述](https://img-blog.csdnimg.cn/20190812133923856.PNG在这里插入图片描述
点击“install package”在这里插入图片描述
安装成功后打开D:\anaconda\envs\tensorflow\Lib\site-packages\labelImg(找到你使用相对应环境中的site-packages文件夹 因为我用了多个环境这里用的是tensorflow )中的labelimg.py 运行 后 可看到在这里插入图片描述
点击“open”打开要使用的图片的路径-点击在这里插入图片描述

在这里插入图片描述
下一张
一直到自己的图片打完为止
找到自己打完标签后的xml文件路径
(二)xml 转换csv

# -*- coding: utf-8 -*-


import os

import glob

import pandas as pd

import xml.etree.ElementTree as ET

# 用于改变当前工作目录到指定的路径。
os.chdir(r'C:\Users\Administrator\Desktop\实验手册\soursexml')

# 图片路径
path = r'C:\Users\Administrator\Desktop\实验手册\soursexml'

def xml_to_csv(path):
    counter = 0;

    xml_list = []

    for xml_file in glob.glob(path + '/*.xml'):

        counter = counter + 1;

        tree = ET.parse(xml_file)

        root = tree.getroot()

        for member in root.findall('object'):
            value = (root.find('filename').text,

                     int(root.find('size')[0].text),

                     int(root.find('size')[1].text),

                     member[0].text,

                     int(member[4][0].text),

                     int(member[4][1].text),

                     int(member[4][2].text),

                     int(member[4][3].text)

                     )

            xml_list.append(value)
        print(xml_list)

    column_name = ['filename', 'width', 'height', 'class', 'xmin', 'ymin', 'xmax', 'ymax']

    xml_df = pd.DataFrame(xml_list, columns=column_name)

    print(xml_df)

    print('执行', counter, '次!')

    return xml_df


def main():
    image_path = path

    xml_df = xml_to_csv(image_path)

    #    xml_df.to_csv('arthritis_test.csv', index=None)

    xml_df.to_csv('arthritis_test.csv', index=None)

    print('Successfully converted xml to csv.')


main()

改变path 和os.chdir 到自己的使用 labelimg 生成的xml文件目录
运行程序后会得到一个csv文件
在这里插入图片描述
()在这里插入图片描述
(三)生成tfrecord文件

"""

Usage:

  # From tensorflow/models/

  # Create train data:

  python generate_tfrecord.py --csv_input=data/tv_vehicle_labels.csv  --output_path=train.record

  # Create test data:

  python generate_tfrecord.py --csv_input=data/test_labels.csv  --output_path=test.record

"""

import os

import io

import pandas as pd

import tensorflow as tf

from PIL import Image

from object_detection.utils import dataset_util

from collections import namedtuple, OrderedDict

os.chdir(r'D:\anaconda\envs\tensorflow\download\models-master\research\object_detection')

# 这里改自己的object_detection的路径下


flags = tf.app.flags

flags.DEFINE_string('csv_input', '', 'Path to the CSV input')

flags.DEFINE_string('output_path', '', 'Path to output TFRecord')

FLAGS = flags.FLAGS


# TO-DO replace this with label map

# 注意将对应的label改成自己的类别!!!!!!!!!!

def class_text_to_int(row_label):
    if row_label == 'daisy':

        return 1

    # elif row_label == 'vehicle':
    #
    #     return 2

    else:

        None


def split(df, group):
    data = namedtuple('data', ['filename', 'object'])

    gb = df.groupby(group)

    return [data(filename, gb.get_group(x)) for filename, x in zip(gb.groups.keys(), gb.groups)]


def create_tf_example(group, path):
    with tf.gfile.GFile(os.path.join(path, '{}'.format(group.filename)), 'rb') as fid:
        encoded_jpg = fid.read()

    encoded_jpg_io = io.BytesIO(encoded_jpg)

    image = Image.open(encoded_jpg_io)

    width, height = image.size

    filename = group.filename.encode('utf8')

    image_format = b'jpg'

    xmins = []

    xmaxs = []

    ymins = []

    ymaxs = []

    classes_text = []

    classes = []

    for index, row in group.object.iterrows():
        xmins.append(row['xmin'] / width)

        xmaxs.append(row['xmax'] / width)

        ymins.append(row['ymin'] / height)

        ymaxs.append(row['ymax'] / height)

        classes_text.append(row['class'].encode('utf8'))

        classes.append(class_text_to_int(row['class']))

    tf_example = tf.train.Example(features=tf.train.Features(feature={

        'image/height': dataset_util.int64_feature(height),

        'image/width': dataset_util.int64_feature(width),

        'image/filename': dataset_util.bytes_feature(filename),

        'image/source_id': dataset_util.bytes_feature(filename),

        'image/encoded': dataset_util.bytes_feature(encoded_jpg),

        'image/format': dataset_util.bytes_feature(image_format),

        'image/object/bbox/xmin': dataset_util.float_list_feature(xmins),

        'image/object/bbox/xmax': dataset_util.float_list_feature(xmaxs),

        'image/object/bbox/ymin': dataset_util.float_list_feature(ymins),

        'image/object/bbox/ymax': dataset_util.float_list_feature(ymaxs),

        'image/object/class/text': dataset_util.bytes_list_feature(classes_text),

        'image/object/class/label': dataset_util.int64_list_feature(classes),

    }))

    return tf_example


def main(_):
    writer = tf.python_io.TFRecordWriter(FLAGS.output_path)

    path = os.path.join(os.getcwd(), 'images')

    examples = pd.read_csv(FLAGS.csv_input)

    grouped = split(examples, 'filename')

    for group in grouped:
        tf_example = create_tf_example(group, path)

        writer.write(tf_example.SerializeToString())

    writer.close()

    output_path = os.path.join(os.getcwd(), FLAGS.output_path)

    print('Successfully created the TFRecords: {}'.format(output_path))


if __name__ == '__main__':
    tf.app.run()

运行

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_15205173/article/details/99297197

智能推荐

指向函数的指针定义与使用_daisyleedq的博客-程序员秘密

来自百度知道的一篇回答,非常详尽剑侠→战天意:http://zhidao.baidu.com/link?url=SETuZnCKOvjBpNTBzRi8nxR3tRIcLbcGyTwszjdeUujNGQohPs0T1RDf9XEsWFCjBEi3yvuEf5GUAcDI0lkJ_q看完以下的,您就知道什么是指向函数的指针了,其实就是回调函数!程序员常常需要实现回调。本文将讨论

tensorflow.python.framework.errors_impl.InvalidArgumentError: slice index 0 of dimension 0 out of bo_NuerNuer的博客-程序员秘密

tensorflow.python.framework.errors_impl.InvalidArgumentError: slice index 0 of dimension0 out of bounds. for 'strided_slice' (op: 'StridedSlice') with input shapes: [0], [1], [1], [1] and with computed input tensors: input[1] = <0>, input[2] = <

linux 进程 信息,linux 获取进程信息_Jerry大王的博客-程序员秘密

static pid_t getpidbyname (char *name){DIR *dirHandle; /* 目录句柄 */struct dirent *dirEntry; /* 单个目录项 */psinfo_t prp;pid_t pid = -1;char strPathName[100];FILE ...

彦舜原创,CSDN首发:接口代理设计(重要),详解代码原义,思路清晰直观,易于学习,适合有基础的人亦适合初学者(那天,夕阳西下)_彦舜的博客-程序员秘密

/** * */package cm.interfaces.factory;/** * @author 彦舜 * */public class ModelFsixtyNine { /** * */ public ModelFsixtyNine() { // TODO Auto-generated constructor stub } /** * @param args */ public static void main(String[] args)

Java程序员进化为架构师掌握的知识_如何从程序员完成到架构师的进化?_红豆和绿豆的博客-程序员秘密

Java程序员进化为架构师掌握的知识一:Java知识1、进制转换2、Java基本数据类型面向对象相关知识3、类、接口、抽象类this关键字、static关键字、final关键字方法的参数传递机制Java垃圾回收机制四种内部类的实现方式方法重写(override)与重载(overload)的联系与区别通过多态实现程序代码的松耦合Java 异常体系详解(

安卓圆形图像_maskedimage_深圳陈冠希丶的博客-程序员秘密

**请大家关注下我的微信公众号:哦哦猿 QQ群:535830326** 在开发中,我们会遇见很多问题,比如我现在说的这个问题,就是经常遇见的。 那就是圆形图像,做图像的时候,我就会遇见,还有一些显示图片的时候 废话不说,直接代码。 新建一个类,我们取名字叫做:CircularImage.javapackage com.ooyuan.myview;import android.conte

随便推点

STM32 磁场传感器HMC5883_普通网友的博客-程序员秘密

一、IIC协议默认(出厂) HMC5883LL 7 位从机地址为0x3C 的写入操作,或0x3D 的读出操作。要改变测量模式到连续测量模式,在通电时间后传送三个字节:0x3C 0x02 0x00将00写入第二寄存器或模式寄存器以完成从单一模式切换到连续测量模式的设置。随着数据速率在出厂默认的15Hz更新,在查询HMC5883L数据寄存器进行新的测量之前,I2C主机允许产生一个...

【ACM】- PAT. A1030 Travel Plan 【图 - 最短路径】_3stone_的博客-程序员秘密

题目链接题目分析:结点编号 0 ~ N-1 题目满足最优子结构,可以直接得出最佳最短路径,也可以先保存所有最短路径,最后统一筛选!思路一:直接在遍历Dijkstra()过程中选出最佳最短路径/***********************************@ID: 3stone*@ACM: PAT.A1030 Travle Plan*@Time: 18/8...

js-六爻排盘一_樱梦雪苹宝的博客-程序员秘密

上篇文章已经写了,js获取时间-天干地支空亡https://blog.csdn.net/yingmengxuepingbao/article/details/110481925,这次记录下,六爻排盘的顺序。 <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>六爻排盘</title> <link rel=...

Gic 中的中断优先级_gic中断优先级_xmys000的博客-程序员秘密

1、中断优先级寄存器每8bit一个中断,但是那些bit有效则是有硬件设计时决定,通过查询ICC_CTLR_EL1/3.PRIbits,具体描述查看4.8.2 priority grouping2、GICD_IPRIORITYR<n> 中的寄存器存放的是spi寄存器,sgi、ppi寄存器的优先级在gicr_ipriority<n>3、gicr_ipriority<n>每核都有可以独立配置4、gic提供了安全和非安全两种基址去访问优优先级设置寄存器。安全态访问

iOS开发中UIImageView逆时针旋转,并得到旋转后的图片_ios开发 imageview旋转_CoderWilly的博客-程序员秘密

很多小伙伴会用系统的动画旋转,但都是顺时针的,但是开发中有些场景需要用到逆时针旋转效果更好,比方说tableView的 展开/收起 指示箭头方向的变换,如果是顺时针复位,就会显得特别别扭。以下一段代码可以解决问题:此处的玄机在于:1.系统认定的旋转都是以原始位置为起点,如果想用 前后两行代码里角度用正负号来实现逆时针旋转,就大错特错了,你会发现它指向是轴对称的。2.关键在于用999...

unittest 单元测试框架详解_unittest框架_康冕峰的博客-程序员秘密

单元测试是一项对技术要求很高的工作,只有白盒测试人员和软件开发人员才能胜任。但用单元测试框架做单元测试却十分简单,而且单元测试框架不仅可以用来做单元测试,它还适用于不同类型的「自动化」测试。1.提供测试用例组织和(批量)执行在 Python 中,我们编写的代码可以定义类、方法和函数,那么如何定义一条「测试用例」?如何灵活地控制这些「测试用例」的执行顺序?单元测试框架会告诉我们。2.提供丰富的断言方法当我们进行功能测试时,测试用例需要有预期结果。当测试用例的执行结果与预期结果不一致时,判定测试用例

推荐文章

热门文章

相关标签