Skip to content

antuansabe/Azure-Vision-Analyzer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🖼️ Azure AI Vision Analyzer

Analizador de imágenes usando Azure AI Vision Service. Detecta objetos, extrae texto (OCR) y genera descripciones automáticas de imágenes.

📋 Descripción

Este proyecto demuestra el uso de Azure AI Computer Vision para:

  • 📝 Generar descripciones automáticas de imágenes
  • 📄 Extraer texto de imágenes (OCR)
  • 🌐 Analizar imágenes desde URLs
  • 🎯 Detectar objetos y áreas específicas

🚀 Tecnologías

  • Python 3.x
  • Azure AI Vision (Computer Vision API)
  • azure-ai-vision-imageanalysis SDK
  • python-dotenv para manejo de credenciales

📦 Instalación

  1. Clonar el repositorio:
git clone https://github.com/antuansabe/Azure-Vision-Analyzer.git
cd Azure-Vision-Analyzer
  1. Crear virtual environment:
python3 -m venv venv
source venv/bin/activate  # En Windows: venv\Scripts\activate
  1. Instalar dependencias:
pip install -r requirements.txt
  1. Configurar credenciales:

Crea un archivo .env en la raíz del proyecto:

VISION_ENDPOINT=tu_endpoint_aqui
VISION_KEY=tu_key_aqui

🎯 Uso

1️⃣ Análisis Básico de Imágenes

python analyze_image.py

Genera descripciones automáticas de imágenes locales.

2️⃣ OCR - Extracción de Texto

python ocr_analyzer.py

Extrae texto de imágenes (facturas, documentos, fotos).

3️⃣ Análisis desde URLs

python url_analyzer.py

Analiza imágenes directamente desde internet sin descargarlas.

📸 Ejemplos de Resultados

Descripción de Imagen:

📝 DESCRIPCIÓN: a dog standing on a deck
✅ Confianza: 81.9%

OCR - Texto Extraído:

📄 TEXTO EXTRAÍDO:
Nutrition Facts
Amount Per Serving
Serving size: 1 bar (40g)
Total Fat 13g
...

Análisis desde URL:

📝 DESCRIPCIÓN PRINCIPAL: a man jumping on a skateboard
✅ Confianza: 85.1%

🛠️ Requisitos de Azure

  1. Cuenta de Azure (gratuita disponible)
  2. Recurso de Azure AI Vision Service
  3. Tier F0 (gratuito): 5,000 llamadas/mes

📁 Estructura del Proyecto

azure-vision-analyzer/
├── analyze_image.py      # Análisis básico
├── ocr_analyzer.py        # Extracción de texto
├── url_analyzer.py        # Análisis desde URLs
├── requirements.txt       # Dependencias
├── .env                   # Credenciales (no incluido en Git)
├── .gitignore            # Archivos a ignorar
└── test_images/          # Imágenes de prueba
    ├── dog.jpg
    └── text_sample.jpg

🔐 Seguridad

  • Las credenciales se almacenan en .env (no versionado)
  • Nunca subas tu archivo .env a Git
  • Usa variables de entorno en producción

📚 Aprendizaje

Este proyecto fue desarrollado como parte del aprendizaje de Azure AI Services.

Conceptos aplicados:

  • Azure AI Vision Service
  • Computer Vision API
  • OCR (Optical Character Recognition)
  • Análisis de imágenes con IA
  • Manejo seguro de credenciales

👤 Autor

Antonio Fernández

📄 Licencia

Este proyecto es de código abierto y está disponible bajo la Licencia MIT.

🔗 Recursos

About

Analizador de imágenes usando Azure AI Vision con OCR

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages