Analizador de imágenes usando Azure AI Vision Service. Detecta objetos, extrae texto (OCR) y genera descripciones automáticas de imágenes.
Este proyecto demuestra el uso de Azure AI Computer Vision para:
- 📝 Generar descripciones automáticas de imágenes
- 📄 Extraer texto de imágenes (OCR)
- 🌐 Analizar imágenes desde URLs
- 🎯 Detectar objetos y áreas específicas
- Python 3.x
- Azure AI Vision (Computer Vision API)
- azure-ai-vision-imageanalysis SDK
- python-dotenv para manejo de credenciales
- Clonar el repositorio:
git clone https://github.com/antuansabe/Azure-Vision-Analyzer.git
cd Azure-Vision-Analyzer- Crear virtual environment:
python3 -m venv venv
source venv/bin/activate # En Windows: venv\Scripts\activate- Instalar dependencias:
pip install -r requirements.txt- Configurar credenciales:
Crea un archivo .env en la raíz del proyecto:
VISION_ENDPOINT=tu_endpoint_aqui
VISION_KEY=tu_key_aqui
python analyze_image.pyGenera descripciones automáticas de imágenes locales.
python ocr_analyzer.pyExtrae texto de imágenes (facturas, documentos, fotos).
python url_analyzer.pyAnaliza imágenes directamente desde internet sin descargarlas.
📝 DESCRIPCIÓN: a dog standing on a deck
✅ Confianza: 81.9%
📄 TEXTO EXTRAÍDO:
Nutrition Facts
Amount Per Serving
Serving size: 1 bar (40g)
Total Fat 13g
...
📝 DESCRIPCIÓN PRINCIPAL: a man jumping on a skateboard
✅ Confianza: 85.1%
- Cuenta de Azure (gratuita disponible)
- Recurso de Azure AI Vision Service
- Tier F0 (gratuito): 5,000 llamadas/mes
azure-vision-analyzer/
├── analyze_image.py # Análisis básico
├── ocr_analyzer.py # Extracción de texto
├── url_analyzer.py # Análisis desde URLs
├── requirements.txt # Dependencias
├── .env # Credenciales (no incluido en Git)
├── .gitignore # Archivos a ignorar
└── test_images/ # Imágenes de prueba
├── dog.jpg
└── text_sample.jpg
- Las credenciales se almacenan en
.env(no versionado) - Nunca subas tu archivo
.enva Git - Usa variables de entorno en producción
Este proyecto fue desarrollado como parte del aprendizaje de Azure AI Services.
Conceptos aplicados:
- Azure AI Vision Service
- Computer Vision API
- OCR (Optical Character Recognition)
- Análisis de imágenes con IA
- Manejo seguro de credenciales
Antonio Fernández
- GitHub: @antuansabe
- Email: antuansabe@gmail.com
Este proyecto es de código abierto y está disponible bajo la Licencia MIT.