Add image generation using fal.ai API

- Implement ImageGenerator class with hero and content image generation - Add image theme prompt generation and caching - Integrate with fal.ai flux-1/schnell API - Add image upload to storage (Bunny CDN) - Add image injection into HTML content - Add test script for image generation - Update database models and repositories for image fields - Fix API usage: use arguments parameter and image_size object format
2025-11-19 17:09:20 -06:00 · 2025-11-19 17:09:20 -06:00 · 8379313f51
parent 01db5cc1c6
commit 8379313f51
12 changed files with 1072 additions and 7 deletions
--- a/env.example
+++ b/env.example
@ -49,6 +49,9 @@ CLOUDFLARE_ACCOUNT_ID=your_cloudflare_account_id_here
 LINK_BUILDER_API_URL=http://localhost:8001/api
 LINK_BUILDER_API_KEY=your_link_builder_api_key_here
 # fal.ai Image Generation API
 FAL_API_KEY=your_fal_api_key_here
 # Application Configuration
 LOG_LEVEL=INFO
 ENVIRONMENT=development
--- a/requirements.txt
+++ b/requirements.txt
@ -32,7 +32,7 @@ beautifulsoup4==4.14.2
 # AI/ML
 openai==2.5.0
-
+fal-client==0.9.1
 # Testing
 pytest==8.4.2
 pytest-asyncio==0.21.1
--- a/scripts/migrate_add_image_fields.py
+++ b/scripts/migrate_add_image_fields.py
@ -0,0 +1,101 @@
 """
 Migration script to add image fields to projects and generated_content tables
 Story 7.1: Generate and Insert Images into Articles
 """
 import sys
 from pathlib import Path
 sys.path.insert(0, str(Path(__file__).parent.parent))
 from src.database.session import db_manager
 from sqlalchemy import text
 def migrate():
    """Add image fields to projects and generated_content tables"""
    session = db_manager.get_session()
    try:
        print("Starting migration: Add image fields...")
        print("  Adding image_theme_prompt to projects table...")
        session.execute(text("""
            ALTER TABLE projects 
            ADD COLUMN image_theme_prompt TEXT NULL
        """))
        print("  Adding hero_image_url to generated_content table...")
        session.execute(text("""
            ALTER TABLE generated_content 
            ADD COLUMN hero_image_url TEXT NULL
        """))
        print("  Adding content_images to generated_content table...")
        session.execute(text("""
            ALTER TABLE generated_content 
            ADD COLUMN content_images JSON NULL
        """))
        session.commit()
        print("Migration completed successfully!")
        print("\nNew fields added:")
        print("  - projects.image_theme_prompt (TEXT, nullable)")
        print("  - generated_content.hero_image_url (TEXT, nullable)")
        print("  - generated_content.content_images (JSON, nullable)")
    except Exception as e:
        session.rollback()
        print(f"Migration failed: {e}")
        raise
    finally:
        session.close()
 def rollback():
    """Rollback migration (remove image fields)"""
    session = db_manager.get_session()
    try:
        print("Rolling back migration: Remove image fields...")
        print("  Removing content_images column...")
        session.execute(text("""
            ALTER TABLE generated_content 
            DROP COLUMN content_images
        """))
        print("  Removing hero_image_url column...")
        session.execute(text("""
            ALTER TABLE generated_content 
            DROP COLUMN hero_image_url
        """))
        print("  Removing image_theme_prompt column...")
        session.execute(text("""
            ALTER TABLE projects 
            DROP COLUMN image_theme_prompt
        """))
        session.commit()
        print("Rollback completed successfully!")
    except Exception as e:
        session.rollback()
        print(f"Rollback failed: {e}")
        raise
    finally:
        session.close()
 if __name__ == "__main__":
    if len(sys.argv) > 1 and sys.argv[1] == "rollback":
        rollback()
    else:
        migrate()
--- a/scripts/test_image_generation.py
+++ b/scripts/test_image_generation.py
@ -0,0 +1,288 @@
 """
 Test script to generate images for existing articles
 Tests image generation on project 23: first 2 T1 articles and first 3 T2 articles
 """
 import sys
 from pathlib import Path
 sys.path.insert(0, str(Path(__file__).parent.parent))
 from src.database.session import db_manager
 from src.database.repositories import (
    ProjectRepository,
    GeneratedContentRepository,
    SiteDeploymentRepository
 )
 from src.generation.service import ContentGenerator
 from src.generation.ai_client import AIClient, PromptManager
 from src.generation.image_generator import ImageGenerator, truncate_title, slugify
 from src.generation.image_injection import insert_hero_after_h1, insert_content_images_after_h2s, generate_alt_text
 from src.generation.image_upload import upload_image_to_storage
 from src.deployment.bunny_storage import BunnyStorageClient
 from src.core.config import get_config
 import click
 import random
 from pathlib import Path
 def test_image_generation(project_id: int):
    """Test image generation on existing articles"""
    # Create output directory for test images
    output_dir = Path("test_images")
    output_dir.mkdir(exist_ok=True)
    click.echo(f"Test images will be saved to: {output_dir.absolute()}\n")
    session = db_manager.get_session()
    try:
        # Get repositories
        project_repo = ProjectRepository(session)
        content_repo = GeneratedContentRepository(session)
        site_repo = SiteDeploymentRepository(session)
        # Get project
        project = project_repo.get_by_id(project_id)
        if not project:
            click.echo(f"Project {project_id} not found")
            return
        click.echo(f"\n{'='*60}")
        click.echo(f"Testing Image Generation for Project {project_id}")
        click.echo(f"Project: {project.name}")
        click.echo(f"Main Keyword: {project.main_keyword}")
        click.echo(f"{'='*60}\n")
        # Get articles
        t1_articles = content_repo.get_by_project_and_tier(project_id, "tier1", require_site=False)
        t2_articles = content_repo.get_by_project_and_tier(project_id, "tier2", require_site=False)
        click.echo(f"Found {len(t1_articles)} T1 articles, using first 2")
        click.echo(f"Found {len(t2_articles)} T2 articles, using first 3\n")
        # Initialize AI client and image generator
        import os
        from dotenv import load_dotenv
        load_dotenv()
        api_key = os.getenv("OPENROUTER_API_KEY")
        if not api_key:
            click.echo("Error: OPENROUTER_API_KEY not set in environment", err=True)
            return
        fal_api_key = os.getenv("FAL_API_KEY")
        if not fal_api_key:
            click.echo("\n[WARN] FAL_API_KEY not set - image generation will fail")
            click.echo("   Set FAL_API_KEY in your .env file to test image generation\n")
        ai_client = AIClient(
            api_key=api_key,
            model=os.getenv("AI_MODEL", "gpt-4o-mini")
        )
        prompt_manager = PromptManager()
        image_generator = ImageGenerator(
            ai_client=ai_client,
            prompt_manager=prompt_manager,
            project_repo=project_repo
        )
        storage_client = BunnyStorageClient()
        # Test T1 articles (first 2)
        click.echo(f"\n{'='*60}")
        click.echo("T1 ARTICLES")
        click.echo(f"{'='*60}\n")
        for i, article in enumerate(t1_articles[:2], 1):
            click.echo(f"\n--- T1 Article {i}: {article.title[:60]}... ---")
            if not article.site_deployment_id:
                click.echo("  [WARN] No site assigned, skipping image upload")
                site = None
            else:
                site = site_repo.get_by_id(article.site_deployment_id)
                if not site:
                    click.echo("  [WARN] Site not found, skipping image upload")
                    site = None
            # Generate theme prompt (if not exists)
            click.echo("\n1. Theme Prompt:")
            if project.image_theme_prompt:
                click.echo(f"   (Using cached): {project.image_theme_prompt}")
            else:
                click.echo("   Generating theme prompt...")
                theme = image_generator.get_theme_prompt(project_id)
                click.echo(f"   Generated: {theme}")
            # Generate hero image
            click.echo("\n2. Hero Image:")
            try:
                # Show the prompt that will be used
                theme = image_generator.get_theme_prompt(project_id)
                title_short = truncate_title(article.title, 4)
                hero_prompt = f"{theme} Text: '{title_short}' in clean simple uppercase letters, positioned in middle of image."
                click.echo(f"   Prompt: {hero_prompt}")
                hero_image = image_generator.generate_hero_image(
                    project_id=project_id,
                    title=article.title,
                    width=1280,
                    height=720
                )
                if hero_image:
                    click.echo(f"   [OK] Generated ({len(hero_image):,} bytes)")
                    # Save to local file
                    main_keyword_slug = slugify(project.main_keyword)
                    local_file = output_dir / f"hero-t1-{main_keyword_slug}-{i}.jpg"
                    local_file.write_bytes(hero_image)
                    click.echo(f"   [OK] Saved to: {local_file}")
                    if site:
                        file_path = f"images/{main_keyword_slug}.jpg"
                        hero_url = upload_image_to_storage(storage_client, site, hero_image, file_path)
                        if hero_url:
                            click.echo(f"   [OK] Uploaded: {hero_url}")
                        else:
                            click.echo("   [FAIL] Upload failed")
                    else:
                        click.echo("   (Skipped upload - no site)")
                else:
                    click.echo("   [FAIL] Generation failed")
            except Exception as e:
                click.echo(f"   [ERROR] {str(e)[:200]}")
            # Generate content images (1-3 for T1)
            click.echo("\n3. Content Images:")
            num_content_images = random.randint(1, 3)
            click.echo(f"   Generating {num_content_images} content image(s)...")
            entities = project.entities or []
            related_searches = project.related_searches or []
            if not entities or not related_searches:
                click.echo("   [WARN] No entities/related_searches, skipping")
            else:
                for j in range(num_content_images):
                    entity = random.choice(entities)
                    related_search = random.choice(related_searches)
                    click.echo(f"\n   Image {j+1}/{num_content_images}:")
                    click.echo(f"   Entity: {entity}")
                    click.echo(f"   Related Search: {related_search}")
                    try:
                        # Show the prompt that will be used
                        theme = image_generator.get_theme_prompt(project_id)
                        content_prompt = f"{theme} Focus on {entity} and {related_search}, professional illustration style."
                        click.echo(f"   Prompt: {content_prompt}")
                        content_image = image_generator.generate_content_image(
                            project_id=project_id,
                            entity=entity,
                            related_search=related_search,
                            width=512,
                            height=512
                        )
                        if content_image:
                            click.echo(f"   [OK] Generated ({len(content_image):,} bytes)")
                            # Save to local file
                            main_keyword_slug = slugify(project.main_keyword)
                            entity_slug = slugify(entity)
                            related_slug = slugify(related_search)
                            local_file = output_dir / f"content-{main_keyword_slug}-{i}-{j+1}-{entity_slug}-{related_slug}.jpg"
                            local_file.write_bytes(content_image)
                            click.echo(f"   [OK] Saved to: {local_file}")
                            if site:
                                file_path = f"images/{main_keyword_slug}-{entity_slug}-{related_slug}.jpg"
                                img_url = upload_image_to_storage(storage_client, site, content_image, file_path)
                                if img_url:
                                    click.echo(f"   [OK] Uploaded: {img_url}")
                                else:
                                    click.echo("   [FAIL] Upload failed")
                            else:
                                click.echo("   (Skipped upload - no site)")
                        else:
                            click.echo("   [FAIL] Generation failed")
                    except Exception as e:
                        click.echo(f"   [ERROR] {str(e)[:200]}")
        # Test T2 articles (first 3)
        click.echo(f"\n\n{'='*60}")
        click.echo("T2 ARTICLES")
        click.echo(f"{'='*60}\n")
        for i, article in enumerate(t2_articles[:3], 1):
            click.echo(f"\n--- T2 Article {i}: {article.title[:60]}... ---")
            if not article.site_deployment_id:
                click.echo("  [WARN] No site assigned, skipping image upload")
                site = None
            else:
                site = site_repo.get_by_id(article.site_deployment_id)
                if not site:
                    click.echo("  [WARN] Site not found, skipping image upload")
                    site = None
            # Generate hero image only (T2 doesn't get content images by default)
            click.echo("\n1. Hero Image:")
            try:
                # Show the prompt that will be used
                theme = image_generator.get_theme_prompt(project_id)
                title_short = truncate_title(article.title, 4)
                hero_prompt = f"{theme} Text: '{title_short}' in clean simple uppercase letters, positioned in middle of image."
                click.echo(f"   Prompt: {hero_prompt}")
                hero_image = image_generator.generate_hero_image(
                    project_id=project_id,
                    title=article.title,
                    width=1280,
                    height=720
                )
                if hero_image:
                    click.echo(f"   [OK] Generated ({len(hero_image):,} bytes)")
                    # Save to local file
                    main_keyword_slug = slugify(project.main_keyword)
                    local_file = output_dir / f"hero-t2-{main_keyword_slug}-{i}.jpg"
                    local_file.write_bytes(hero_image)
                    click.echo(f"   [OK] Saved to: {local_file}")
                    if site:
                        file_path = f"images/{main_keyword_slug}.jpg"
                        hero_url = upload_image_to_storage(storage_client, site, hero_image, file_path)
                        if hero_url:
                            click.echo(f"   [OK] Uploaded: {hero_url}")
                        else:
                            click.echo("   [FAIL] Upload failed")
                    else:
                        click.echo("   (Skipped upload - no site)")
                else:
                    click.echo("   [FAIL] Generation failed")
            except Exception as e:
                click.echo(f"   [ERROR] {str(e)[:200]}")
            click.echo("\n2. Content Images:")
            click.echo("   (Skipped - T2 articles don't get content images by default)")
        click.echo(f"\n\n{'='*60}")
        click.echo("TEST COMPLETE")
        click.echo(f"{'='*60}\n")
    except Exception as e:
        click.echo(f"Error: {e}", err=True)
        import traceback
        traceback.print_exc()
    finally:
        session.close()
 if __name__ == "__main__":
    test_image_generation(23)
--- a/src/database/models.py
+++ b/src/database/models.py
@ -109,6 +109,7 @@ class Project(Base):
    custom_anchor_text: Mapped[Optional[list]] = mapped_column(JSON, nullable=True)
    spintax_related_search_terms: Mapped[Optional[str]] = mapped_column(Text, nullable=True)
    image_theme_prompt: Mapped[Optional[str]] = mapped_column(Text, nullable=True)
    created_at: Mapped[datetime] = mapped_column(DateTime, default=datetime.utcnow, nullable=False)
    updated_at: Mapped[datetime] = mapped_column(
@ -140,6 +141,8 @@ class GeneratedContent(Base):
    site_deployment_id: Mapped[Optional[int]] = mapped_column(Integer, ForeignKey('site_deployments.id'), nullable=True, index=True)
    deployed_url: Mapped[Optional[str]] = mapped_column(Text, nullable=True)
    deployed_at: Mapped[Optional[datetime]] = mapped_column(DateTime, nullable=True, index=True)
    hero_image_url: Mapped[Optional[str]] = mapped_column(Text, nullable=True)
    content_images: Mapped[Optional[list]] = mapped_column(JSON, nullable=True)
    created_at: Mapped[datetime] = mapped_column(DateTime, default=datetime.utcnow, nullable=False)
    updated_at: Mapped[datetime] = mapped_column(
        DateTime, 
--- a/src/database/repositories.py
+++ b/src/database/repositories.py
@ -411,7 +411,9 @@ class GeneratedContentRepository:
        content: str,
        word_count: int,
        status: str,
-        site_deployment_id: Optional[int] = None
+        site_deployment_id: Optional[int] = None,
        hero_image_url: Optional[str] = None,
        content_images: Optional[list] = None
    ) -> GeneratedContent:
        """
        Create a new generated content record
@ -439,7 +441,9 @@ class GeneratedContentRepository:
            content=content,
            word_count=word_count,
            status=status,
-            site_deployment_id=site_deployment_id
+            site_deployment_id=site_deployment_id,
            hero_image_url=hero_image_url,
            content_images=content_images
        )
        self.session.add(content_record)
--- a/src/generation/batch_processor.py
+++ b/src/generation/batch_processor.py
@ -21,6 +21,11 @@ from src.generation.site_assignment import assign_sites_to_batch
 from src.deployment.bunny_storage import BunnyStorageClient
 from src.deployment.deployment_service import DeploymentService
 from src.deployment.url_logger import URLLogger
 from src.generation.image_generator import ImageGenerator
 from src.generation.image_injection import insert_hero_after_h1, insert_content_images_after_h2s, generate_alt_text
 from src.generation.image_upload import upload_image_to_storage
 from src.generation.image_generator import slugify
 import random
 class BatchProcessor:
@ -352,6 +357,17 @@ class BatchProcessor:
            status = "augmented"
            self.stats["augmented_articles"] += 1
        # Generate and insert images
        content, hero_url, content_image_urls = self._generate_and_insert_images(
            project_id=project_id,
            tier_name=tier_name,
            tier_config=tier_config,
            title=title,
            content=content,
            site_deployment_id=site_deployment_id,
            prefix=prefix
        )
        saved_content = self.content_repo.create(
            project_id=project_id,
            tier=tier_name,
@ -361,11 +377,128 @@ class BatchProcessor:
            content=content,
            word_count=word_count,
            status=status,
-            site_deployment_id=site_deployment_id
+            site_deployment_id=site_deployment_id,
            hero_image_url=hero_url,
            content_images=content_image_urls if content_image_urls else None
        )
        click.echo(f"{prefix} Saved (ID: {saved_content.id}, Status: {status})")
    def _generate_and_insert_images(
        self,
        project_id: int,
        tier_name: str,
        tier_config: TierConfig,
        title: str,
        content: str,
        site_deployment_id: Optional[int],
        prefix: str
    ) -> tuple[str, Optional[str], List[str]]:
        """
        Generate images and insert into HTML content
        Note: image_config is always created by job config parser (with defaults if not in JSON).
        Defaults: hero images for all tiers (1280x720), content images for T1 only (1-3 images).
        """
        if not tier_config.image_config:
            return content, None, []
        project = self.project_repo.get_by_id(project_id)
        if not project:
            return content, None, []
        # Initialize image generator
        image_generator = ImageGenerator(
            ai_client=self.generator.ai_client,
            prompt_manager=self.generator.prompt_manager,
            project_repo=self.project_repo
        )
        storage_client = BunnyStorageClient()
        hero_url = None
        content_image_urls = []
        # Generate hero image (all tiers if enabled)
        if tier_config.image_config.hero:
            try:
                click.echo(f"{prefix} Generating hero image...")
                hero_image = image_generator.generate_hero_image(
                    project_id=project_id,
                    title=title,
                    width=tier_config.image_config.hero.width,
                    height=tier_config.image_config.hero.height
                )
                if hero_image and site_deployment_id:
                    site = self.site_deployment_repo.get_by_id(site_deployment_id) if self.site_deployment_repo else None
                    if site:
                        main_keyword_slug = slugify(project.main_keyword)
                        file_path = f"images/{main_keyword_slug}.jpg"
                        hero_url = upload_image_to_storage(storage_client, site, hero_image, file_path)
                        if hero_url:
                            click.echo(f"{prefix} Hero image uploaded: {hero_url}")
                        else:
                            click.echo(f"{prefix} Hero image upload failed")
            except Exception as e:
                click.echo(f"{prefix} Hero image generation failed: {e}")
        # Generate content images (T1 only, if enabled)
        if tier_config.image_config.content and tier_config.image_config.content.max_num_images > 0:
            try:
                num_images = random.randint(
                    tier_config.image_config.content.min_num_images,
                    tier_config.image_config.content.max_num_images
                )
                if num_images > 0:
                    click.echo(f"{prefix} Generating {num_images} content image(s)...")
                    entities = project.entities or []
                    related_searches = project.related_searches or []
                    if not entities or not related_searches:
                        click.echo(f"{prefix} Skipping content images (no entities/related_searches)")
                    else:
                        for i in range(num_images):
                            try:
                                entity = random.choice(entities)
                                related_search = random.choice(related_searches)
                                content_image = image_generator.generate_content_image(
                                    project_id=project_id,
                                    entity=entity,
                                    related_search=related_search,
                                    width=tier_config.image_config.content.width,
                                    height=tier_config.image_config.content.height
                                )
                                if content_image and site_deployment_id:
                                    site = self.site_deployment_repo.get_by_id(site_deployment_id) if self.site_deployment_repo else None
                                    if site:
                                        main_keyword_slug = slugify(project.main_keyword)
                                        entity_slug = slugify(entity)
                                        related_slug = slugify(related_search)
                                        file_path = f"images/{main_keyword_slug}-{entity_slug}-{related_slug}.jpg"
                                        img_url = upload_image_to_storage(storage_client, site, content_image, file_path)
                                        if img_url:
                                            content_image_urls.append(img_url)
                                            click.echo(f"{prefix} Content image {i+1}/{num_images} uploaded")
                            except Exception as e:
                                click.echo(f"{prefix} Content image {i+1} generation failed: {e}")
            except Exception as e:
                click.echo(f"{prefix} Content image generation failed: {e}")
        # Insert images into HTML
        if hero_url:
            alt_text = generate_alt_text(project)
            content = insert_hero_after_h1(content, hero_url, alt_text)
        if content_image_urls:
            alt_texts = [generate_alt_text(project) for _ in content_image_urls]
            content = insert_content_images_after_h2s(content, content_image_urls, alt_texts)
        return content, hero_url, content_image_urls
    def _process_articles_concurrent(
        self,
        article_tasks: List[Dict[str, Any]],
@ -547,6 +680,17 @@ class BatchProcessor:
                with self.stats_lock:
                    self.stats["augmented_articles"] += 1
            # Generate and insert images
            content, hero_url, content_image_urls = self._generate_and_insert_images(
                project_id=project_id,
                tier_name=tier_name,
                tier_config=tier_config,
                title=title,
                content=content,
                site_deployment_id=site_deployment_id,
                prefix=prefix
            )
            saved_content = thread_content_repo.create(
                project_id=project_id,
                tier=tier_name,
@ -556,7 +700,9 @@ class BatchProcessor:
                content=content,
                word_count=word_count,
                status=status,
-                site_deployment_id=site_deployment_id
+                site_deployment_id=site_deployment_id,
                hero_image_url=hero_url,
                content_images=content_image_urls if content_image_urls else None
            )
            thread_session.commit()
--- a/src/generation/image_generator.py
+++ b/src/generation/image_generator.py
@ -0,0 +1,222 @@
 """
 Image generation using fal.ai FLUX.1 schnell API
 """
 import os
 import re
 import random
 import logging
 import requests
 from typing import Optional, Tuple
 from concurrent.futures import ThreadPoolExecutor, as_completed
 import fal_client
 from src.generation.ai_client import AIClient, PromptManager
 from src.database.repositories import ProjectRepository
 logger = logging.getLogger(__name__)
 def truncate_title(title: str, max_words: int = 4) -> str:
    """Truncate title to max_words and convert to UPPERCASE"""
    words = title.split()[:max_words]
    return " ".join(words).upper()
 def slugify(text: str) -> str:
    """Convert text to URL-friendly slug"""
    text = text.lower()
    text = re.sub(r'[^a-z0-9]+', '-', text)
    text = text.strip('-')
    return text
 class ImageGenerator:
    """Generate images using fal.ai API"""
    def __init__(
        self,
        ai_client: AIClient,
        prompt_manager: PromptManager,
        project_repo: ProjectRepository
    ):
        self.ai_client = ai_client
        self.prompt_manager = prompt_manager
        self.project_repo = project_repo
        # fal_client library expects FAL_KEY, but we use FAL_API_KEY in our env
        # Set both for compatibility
        self.fal_key = os.getenv("FAL_API_KEY") or os.getenv("FAL_KEY")
        if self.fal_key and not os.getenv("FAL_KEY"):
            os.environ["FAL_KEY"] = self.fal_key
        if not self.fal_key:
            logger.warning("FAL_API_KEY not set, image generation will fail")
        self.max_concurrent = 5
        self.executor = ThreadPoolExecutor(max_workers=self.max_concurrent)
    def get_theme_prompt(self, project_id: int) -> str:
        """Get or generate theme prompt for project"""
        project = self.project_repo.get_by_id(project_id)
        if not project:
            raise ValueError(f"Project {project_id} not found")
        if project.image_theme_prompt:
            return project.image_theme_prompt
        # Generate theme prompt using AI
        entities_str = ", ".join(project.entities or [])
        related_str = ", ".join(project.related_searches or [])
        system_msg, user_prompt = self.prompt_manager.format_prompt(
            "image_theme_generation",
            main_keyword=project.main_keyword,
            entities=entities_str,
            related_searches=related_str
        )
        theme_prompt, _ = self.ai_client.generate_completion(
            prompt=user_prompt,
            system_message=system_msg,
            max_tokens=200,
            temperature=0.7
        )
        # Save to project
        project.image_theme_prompt = theme_prompt.strip()
        self.project_repo.session.commit()
        logger.info(f"Generated theme prompt for project {project_id}")
        return project.image_theme_prompt
    def generate_hero_image(
        self,
        project_id: int,
        title: str,
        width: int = 1280,
        height: int = 720
    ) -> Optional[bytes]:
        """Generate hero image with title text"""
        if not self.fal_key:
            logger.error("FAL_API_KEY not set")
            return None
        try:
            theme = self.get_theme_prompt(project_id)
            title_short = truncate_title(title, 4)
            prompt = f"{theme} Text: '{title_short}' in clean simple uppercase letters, positioned in middle of image."
            logger.info(f"Generating hero image with prompt: {prompt}")
            result = fal_client.subscribe(
                "fal-ai/flux-1/schnell",
                arguments={
                    "prompt": prompt,
                    "image_size": {"width": width, "height": height},
                    "num_inference_steps": 4,
                    "guidance_scale": 3.5,
                    "output_format": "jpeg"
                },
                with_logs=True
            )
            logger.debug(f"API response keys: {result.keys() if result else 'None'}")
            logger.debug(f"API response type: {type(result)}")
            # Check different possible response structures
            images = None
            if result:
                if "images" in result:
                    images = result["images"]
                elif "data" in result and "images" in result["data"]:
                    images = result["data"]["images"]
                elif isinstance(result, dict) and len(result) == 1 and "images" in list(result.values())[0]:
                    images = list(result.values())[0]["images"]
            if images and len(images) > 0:
                image_data = images[0]
                image_url = image_data.get("url")
                if not image_url:
                    logger.error(f"No URL in image response. Image data keys: {image_data.keys() if isinstance(image_data, dict) else 'not a dict'}")
                    return None
                logger.info(f"Downloading hero image from URL: {image_url}")
                response = requests.get(image_url, timeout=30)
                response.raise_for_status()
                return response.content
            logger.error(f"No image returned from fal.ai. Response: {result}")
            return None
        except Exception as e:
            logger.error(f"Failed to generate hero image: {e}", exc_info=True)
            logger.error(f"Exception type: {type(e).__name__}")
            if hasattr(e, 'response'):
                logger.error(f"Response: {e.response}")
            return None
    def generate_content_image(
        self,
        project_id: int,
        entity: str,
        related_search: str,
        width: int = 512,
        height: int = 512
    ) -> Optional[bytes]:
        """Generate content image with entity and related search"""
        if not self.fal_key:
            logger.error("FAL_API_KEY not set")
            return None
        try:
            theme = self.get_theme_prompt(project_id)
            prompt = f"{theme} Focus on {entity} and {related_search}, professional illustration style."
            logger.info(f"Generating content image with prompt: {prompt}")
            result = fal_client.subscribe(
                "fal-ai/flux-1/schnell",
                arguments={
                    "prompt": prompt,
                    "image_size": {"width": width, "height": height},
                    "num_inference_steps": 4,
                    "guidance_scale": 3.5,
                    "output_format": "jpeg"
                },
                with_logs=True
            )
            logger.debug(f"API response keys: {result.keys() if result else 'None'}")
            logger.debug(f"API response type: {type(result)}")
            # Check different possible response structures
            images = None
            if result:
                if "images" in result:
                    images = result["images"]
                elif "data" in result and "images" in result["data"]:
                    images = result["data"]["images"]
                elif isinstance(result, dict) and len(result) == 1 and "images" in list(result.values())[0]:
                    images = list(result.values())[0]["images"]
            if images and len(images) > 0:
                image_data = images[0]
                image_url = image_data.get("url")
                if not image_url:
                    logger.error(f"No URL in image response. Image data keys: {image_data.keys() if isinstance(image_data, dict) else 'not a dict'}")
                    return None
                logger.info(f"Downloading content image from URL: {image_url}")
                response = requests.get(image_url, timeout=30)
                response.raise_for_status()
                return response.content
            logger.error(f"No image returned from fal.ai. Response: {result}")
            return None
        except Exception as e:
            logger.error(f"Failed to generate content image: {e}", exc_info=True)
            logger.error(f"Exception type: {type(e).__name__}")
            if hasattr(e, 'response'):
                logger.error(f"Response: {e.response}")
            return None
--- a/src/generation/image_injection.py
+++ b/src/generation/image_injection.py
@ -0,0 +1,94 @@
 """
 HTML image insertion logic
 """
 import re
 import random
 from typing import List, Optional
 from src.database.models import Project
 def generate_alt_text(project: Project) -> str:
    """Generate alt text with 3 entities and 2 related searches"""
    entities = project.entities or []
    related_searches = project.related_searches or []
    # Pick 3 random entities (or all if less than 3)
    selected_entities = random.sample(entities, min(3, len(entities))) if entities else []
    # Pick 2 random related searches (or all if less than 2)
    selected_related = random.sample(related_searches, min(2, len(related_searches))) if related_searches else []
    # Combine: entity1 related_search1 entity2 related_search2 entity3
    parts = []
    # Add entities and related searches in order: entity1, related1, entity2, related2, entity3
    for i in range(max(len(selected_entities), len(selected_related))):
        if i < len(selected_entities):
            parts.append(selected_entities[i])
        if i < len(selected_related):
            parts.append(selected_related[i])
        if len(parts) >= 5:
            break
    return " ".join(parts[:5]) if parts else project.main_keyword
 def insert_hero_after_h1(html: str, hero_url: str, alt_text: str) -> str:
    """Insert hero image immediately after first H1 tag"""
    # Find first <h1>...</h1>
    pattern = r'(<h1[^>]*>.*?</h1>)'
    match = re.search(pattern, html, re.IGNORECASE | re.DOTALL)
    if match:
        h1_tag = match.group(1)
        img_tag = f'<img src="{hero_url}" alt="{alt_text}" />'
        return html.replace(h1_tag, h1_tag + "\n" + img_tag, 1)
    # If no H1 found, insert at beginning
    img_tag = f'<img src="{hero_url}" alt="{alt_text}" />'
    return img_tag + "\n" + html
 def insert_content_images_after_h2s(html: str, image_urls: List[str], alt_texts: List[str]) -> str:
    """Insert content images after H2 sections, distributed evenly"""
    if not image_urls:
        return html
    # Find all H2 tags
    pattern = r'(<h2[^>]*>.*?</h2>)'
    h2_matches = list(re.finditer(pattern, html, re.IGNORECASE | re.DOTALL))
    if not h2_matches:
        # No H2s, insert at end
        img_tags = [f'<img src="{url}" alt="{alt}" />' for url, alt in zip(image_urls, alt_texts)]
        return html + "\n" + "\n".join(img_tags)
    # Distribute images across H2s
    result = html
    h2_positions = [(m.start(), m.end()) for m in h2_matches]
    # Insert images after H2s, evenly distributed
    images_per_h2 = len(image_urls) / len(h2_matches) if h2_matches else 0
    inserted = 0
    for i, (start, end) in enumerate(h2_positions):
        if inserted >= len(image_urls):
            break
        # Calculate which images to insert after this H2
        start_idx = int(i * images_per_h2)
        end_idx = int((i + 1) * images_per_h2) if i < len(h2_positions) - 1 else len(image_urls)
        if start_idx < len(image_urls):
            h2_tag = html[start:end]
            img_tags = []
            for j in range(start_idx, min(end_idx, len(image_urls))):
                img_tag = f'<img src="{image_urls[j]}" alt="{alt_texts[j] if j < len(alt_texts) else alt_texts[0]}" />'
                img_tags.append(img_tag)
                inserted += 1
            if img_tags:
                replacement = h2_tag + "\n" + "\n".join(img_tags)
                result = result.replace(h2_tag, replacement, 1)
    return result
--- a/src/generation/image_upload.py
+++ b/src/generation/image_upload.py
@ -0,0 +1,65 @@
 """
 Image upload utilities for storage zones
 """
 import logging
 import requests
 from typing import Optional
 from src.deployment.bunny_storage import BunnyStorageClient
 from src.database.models import SiteDeployment
 from src.generation.url_generator import generate_public_url
 logger = logging.getLogger(__name__)
 def upload_image_to_storage(
    storage_client: BunnyStorageClient,
    site: SiteDeployment,
    image_bytes: bytes,
    file_path: str
 ) -> Optional[str]:
    """
    Upload image to storage zone and return public URL
    Args:
        storage_client: BunnyStorageClient instance
        site: SiteDeployment with zone info
        image_bytes: Image file bytes
        file_path: Path within storage zone (e.g., 'images/hero.jpg')
    Returns:
        Public URL if successful, None if failed
    """
    try:
        # Check if file exists first
        base_url = storage_client._get_storage_url(site.storage_zone_region)
        check_url = f"{base_url}/{site.storage_zone_name}/{file_path}"
        headers = {"AccessKey": site.storage_zone_password}
        check_response = requests.head(check_url, headers=headers, timeout=10)
        if check_response.status_code == 200:
            # File exists, return existing URL
            logger.info(f"Image {file_path} already exists, using existing")
            return generate_public_url(site, file_path)
        # Upload image (binary data)
        url = f"{base_url}/{site.storage_zone_name}/{file_path}"
        headers = {
            "AccessKey": site.storage_zone_password,
            "Content-Type": "image/jpeg",
            "accept": "application/json"
        }
        response = requests.put(url, data=image_bytes, headers=headers, timeout=60)
        if response.status_code in [200, 201]:
            logger.info(f"Uploaded image {file_path} to {site.storage_zone_name}")
            return generate_public_url(site, file_path)
        else:
            logger.error(f"Failed to upload image {file_path}: {response.status_code} - {response.text}")
            return None
    except Exception as e:
        logger.error(f"Error uploading image {file_path}: {e}", exc_info=True)
        return None
--- a/src/generation/job_config.py
+++ b/src/generation/job_config.py
@ -67,6 +67,29 @@ class InterlinkingConfig:
    see_also_max: int = 5
@dataclass
 class HeroImageConfig:
    """Configuration for hero images"""
    width: int = 1280
    height: int = 720
@dataclass
 class ContentImageConfig:
    """Configuration for content images"""
    min_num_images: int = 0
    max_num_images: int = 0
    width: int = 512
    height: int = 512
@dataclass
 class ImageConfig:
    """Configuration for image generation"""
    hero: Optional[HeroImageConfig] = None
    content: Optional[ContentImageConfig] = None
@dataclass
 class TierConfig:
    """Configuration for a specific tier"""
@ -79,6 +102,7 @@ class TierConfig:
    max_h3_tags: int
    anchor_text_config: Optional[AnchorTextConfig] = None
    models: Optional[ModelConfig] = None
    image_config: Optional[ImageConfig] = None
@dataclass
@ -344,6 +368,60 @@ class JobConfig:
                content=models_data["content"]
            )
        # Parse image_config if present
        image_config = None
        if "image_config" in tier_data:
            img_data = tier_data["image_config"]
            if not isinstance(img_data, dict):
                raise ValueError(f"'{tier_name}.image_config' must be an object")
            hero_config = None
            if "hero" in img_data:
                hero_data = img_data["hero"]
                if not isinstance(hero_data, dict):
                    raise ValueError(f"'{tier_name}.image_config.hero' must be an object")
                hero_config = HeroImageConfig(
                    width=hero_data.get("width", 1280),
                    height=hero_data.get("height", 720)
                )
            else:
                # Default hero config for all tiers
                hero_config = HeroImageConfig()
            content_config = None
            if "content" in img_data:
                content_data = img_data["content"]
                if not isinstance(content_data, dict):
                    raise ValueError(f"'{tier_name}.image_config.content' must be an object")
                min_imgs = content_data.get("min_num_images", 0)
                max_imgs = content_data.get("max_num_images", 0)
                # Defaults: T1 = 1-3, others = 0-0
                if tier_name == "tier1" and min_imgs == 0 and max_imgs == 0:
                    min_imgs = 1
                    max_imgs = 3
                content_config = ContentImageConfig(
                    min_num_images=min_imgs,
                    max_num_images=max_imgs,
                    width=content_data.get("width", 512),
                    height=content_data.get("height", 512)
                )
            else:
                # Default content config based on tier
                if tier_name == "tier1":
                    content_config = ContentImageConfig(min_num_images=1, max_num_images=3)
                else:
                    content_config = ContentImageConfig(min_num_images=0, max_num_images=0)
            image_config = ImageConfig(hero=hero_config, content=content_config)
        else:
            # Default image config if not specified
            hero_config = HeroImageConfig()
            if tier_name == "tier1":
                content_config = ContentImageConfig(min_num_images=1, max_num_images=3)
            else:
                content_config = ContentImageConfig(min_num_images=0, max_num_images=0)
            image_config = ImageConfig(hero=hero_config, content=content_config)
        return TierConfig(
            count=tier_data.get("count", 1),
            min_word_count=tier_data.get("min_word_count", defaults["min_word_count"]),
@ -353,7 +431,8 @@ class JobConfig:
            min_h3_tags=tier_data.get("min_h3_tags", defaults["min_h3_tags"]),
            max_h3_tags=tier_data.get("max_h3_tags", defaults["max_h3_tags"]),
            anchor_text_config=anchor_text_config,
-            models=tier_models
+            models=tier_models,
            image_config=image_config
        )
    def _parse_tier_from_array(self, tier_name: str, tier_data: dict) -> TierConfig:
@ -379,6 +458,56 @@ class JobConfig:
                raise ValueError(f"'{tier_name}.anchor_text_config' custom_text must be an array")
            anchor_text_config = AnchorTextConfig(mode=mode, custom_text=custom_text)
        # Parse image_config if present (same logic as _parse_tier)
        image_config = None
        if "image_config" in tier_data:
            img_data = tier_data["image_config"]
            if not isinstance(img_data, dict):
                raise ValueError(f"'{tier_name}.image_config' must be an object")
            hero_config = None
            if "hero" in img_data:
                hero_data = img_data["hero"]
                if not isinstance(hero_data, dict):
                    raise ValueError(f"'{tier_name}.image_config.hero' must be an object")
                hero_config = HeroImageConfig(
                    width=hero_data.get("width", 1280),
                    height=hero_data.get("height", 720)
                )
            else:
                hero_config = HeroImageConfig()
            content_config = None
            if "content" in img_data:
                content_data = img_data["content"]
                if not isinstance(content_data, dict):
                    raise ValueError(f"'{tier_name}.image_config.content' must be an object")
                min_imgs = content_data.get("min_num_images", 0)
                max_imgs = content_data.get("max_num_images", 0)
                if tier_name == "tier1" and min_imgs == 0 and max_imgs == 0:
                    min_imgs = 1
                    max_imgs = 3
                content_config = ContentImageConfig(
                    min_num_images=min_imgs,
                    max_num_images=max_imgs,
                    width=content_data.get("width", 512),
                    height=content_data.get("height", 512)
                )
            else:
                if tier_name == "tier1":
                    content_config = ContentImageConfig(min_num_images=1, max_num_images=3)
                else:
                    content_config = ContentImageConfig(min_num_images=0, max_num_images=0)
            image_config = ImageConfig(hero=hero_config, content=content_config)
        else:
            hero_config = HeroImageConfig()
            if tier_name == "tier1":
                content_config = ContentImageConfig(min_num_images=1, max_num_images=3)
            else:
                content_config = ContentImageConfig(min_num_images=0, max_num_images=0)
            image_config = ImageConfig(hero=hero_config, content=content_config)
        return TierConfig(
            count=count,
            min_word_count=tier_data.get("min_word_count", defaults["min_word_count"]),
@ -387,7 +516,8 @@ class JobConfig:
            max_h2_tags=tier_data.get("max_h2_tags", defaults["max_h2_tags"]),
            min_h3_tags=tier_data.get("min_h3_tags", defaults["min_h3_tags"]),
            max_h3_tags=tier_data.get("max_h3_tags", defaults["max_h3_tags"]),
-            anchor_text_config=anchor_text_config
+            anchor_text_config=anchor_text_config,
            image_config=image_config
        )
    def get_jobs(self) -> list[Job]:
--- a/src/generation/prompts/h2-prompts
+++ b/src/generation/prompts/h2-prompts
@ -0,0 +1,9 @@
 h2_prompts = {
    "general": "Clean, professional illustration related to {h2_topic}, modern business style, simple geometric shapes, corporate color palette, minimalist design, high-quality vector art style",
    "technical": "Technical diagram or infographic about {h2_topic}, clean lines, professional schematic style, industrial design, blue and gray tones, modern technical illustration",
    "process": "Step-by-step process visualization for {h2_topic}, clean flowchart style, professional arrows and connections, corporate color scheme, modern infographic design",
    "benefits": "Professional icon-based illustration showing {h2_topic}, clean symbol design, business-friendly colors, modern flat design style, organized layout"
 }