יצירת תמונות באמצעות Gemini

‫Gemini יכול ליצור ולעבד תמונות בשיחה. אתם יכולים לתת ל-Gemini הנחיות באמצעות טקסט, תמונות או שילוב של שניהם, וכך ליצור ולערוך רכיבים חזותיים ולשפר אותם עם שליטה חסרת תקדים:

  • Text-to-Image: יצירת תמונות באיכות גבוהה מתיאורי טקסט פשוטים או מורכבים.
  • תמונה + טקסט לתמונה (עריכה): מספקים תמונה ומשתמשים בהנחיות טקסט כדי להוסיף, להסיר או לשנות רכיבים, לשנות את הסגנון או להתאים את דירוג הצבעים.
  • תמונה מרובת תמונות (העברת קומפוזיציה וסגנון): אפשר להשתמש בכמה תמונות קלט כדי ליצור סצנה חדשה או להעביר את הסגנון מתמונה אחת לתמונה אחרת.
  • שיפור איטרטיבי: אפשר לנהל שיחה כדי לשפר בהדרגה את התמונה בכמה שלבים, ולבצע שינויים קטנים עד שהיא תהיה מושלמת.
  • עיבוד טקסט באיכות גבוהה: יצירת תמונות מדויקות שמכילות טקסט קריא ובמיקום טוב, אידיאלי ללוגו, לדיאגרמות ולפוסטרים.

כל התמונות שנוצרות על ידי AI כוללות סימן מים של SynthID.

יצירת תמונות (טקסט לתמונה)

בדוגמה הבאה מוצג קוד ליצירת תמונה על סמך הנחיה תיאורית.

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

prompt = (
    "Create a picture of a nano banana dish in a fancy restaurant with a Gemini theme"
)

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[prompt],
)

for part in response.candidates[0].content.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = Image.open(BytesIO(part.inline_data.data))
        image.save("generated_image.png")

JavaScript

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({});

  const prompt =
    "Create a picture of a nano banana dish in a fancy restaurant with a Gemini theme";

  const response = await ai.models.generateContent({
    model: "gemini-2.5-flash-image-preview",
    contents: prompt,
  });
  for (const part of response.candidates[0].content.parts) {
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

Go

package main

import (
  "context"
  "fmt"
  "os"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

  result, _ := client.Models.GenerateContent(
      ctx,
      "gemini-2.5-flash-image-preview",
      genai.Text("Create a picture of a nano banana dish in a " +
                 " fancy restaurant with a Gemini theme"),
  )

  for _, part := range result.Candidates[0].Content.Parts {
      if part.Text != "" {
          fmt.Println(part.Text)
      } else if part.InlineData != nil {
          imageBytes := part.InlineData.Data
          outputFilename := "gemini_generated_image.png"
          _ = os.WriteFile(outputFilename, imageBytes, 0644)
      }
  }
}

REST

curl -s -X POST
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Create a picture of a nano banana dish in a fancy restaurant with a Gemini theme"}
      ]
    }]
  }' \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-native-image.png
תמונה מ-AI של מנה של בננה ננו
תמונה שנוצרה על ידי AI של מנת בננה ננו במסעדה עם עיצוב בנושא Gemini

עריכת תמונות (טקסט ותמונה לתמונה)

תזכורת: חשוב לוודא שיש לכם את הזכויות הנדרשות על כל תמונה שאתם מעלים. אסור ליצור תוכן שמפר את הזכויות של אחרים, כולל סרטונים או תמונות שמטעים, מטרידים או פוגעים. השימוש שלך בשירות הזה של AI גנרטיבי כפוף למדיניות שלנו בנושא שימוש אסור.

כדי לערוך תמונה, מוסיפים תמונה כקלט. בדוגמה הבאה מוצג איך מעלים תמונות בקידוד Base64. למידע על העלאה של כמה תמונות, על מטען ייעודי גדול יותר ועל סוגי MIME נתמכים, אפשר לעיין בדף הבנת תמונות.

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

prompt = (
    "Create a picture of my cat eating a nano-banana in a "
    "fancy restaurant under the Gemini constellation",
)

image = Image.open("/path/to/cat_image.png")

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[prompt, image],
)

for part in response.candidates[0].content.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = Image.open(BytesIO(part.inline_data.data))
        image.save("generated_image.png")

JavaScript

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({});

  const imagePath = "path/to/cat_image.png";
  const imageData = fs.readFileSync(imagePath);
  const base64Image = imageData.toString("base64");

  const prompt = [
    { text: "Create a picture of my cat eating a nano-banana in a" +
            "fancy restaurant under the Gemini constellation" },
    {
      inlineData: {
        mimeType: "image/png",
        data: base64Image,
      },
    },
  ];

  const response = await ai.models.generateContent({
    model: "gemini-2.5-flash-image-preview",
    contents: prompt,
  });
  for (const part of response.candidates[0].content.parts) {
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

Go

package main

import (
 "context"
 "fmt"
 "os"
 "google.golang.org/genai"
)

func main() {

 ctx := context.Background()
 client, err := genai.NewClient(ctx, nil)
 if err != nil {
     log.Fatal(err)
 }

 imagePath := "/path/to/cat_image.png"
 imgData, _ := os.ReadFile(imagePath)

 parts := []*genai.Part{
   genai.NewPartFromText("Create a picture of my cat eating a nano-banana in a fancy restaurant under the Gemini constellation"),
   &genai.Part{
     InlineData: &genai.Blob{
       MIMEType: "image/png",
       Data:     imgData,
     },
   },
 }

 contents := []*genai.Content{
   genai.NewContentFromParts(parts, genai.RoleUser),
 }

 result, _ := client.Models.GenerateContent(
     ctx,
     "gemini-2.5-flash-image-preview",
     contents,
 )

 for _, part := range result.Candidates[0].Content.Parts {
     if part.Text != "" {
         fmt.Println(part.Text)
     } else if part.InlineData != nil {
         imageBytes := part.InlineData.Data
         outputFilename := "gemini_generated_image.png"
         _ = os.WriteFile(outputFilename, imageBytes, 0644)
     }
 }
}

REST

IMG_PATH=/path/to/cat_image.jpeg

if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
  B64FLAGS="--input"
else
  B64FLAGS="-w0"
fi

IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" \
    -H "x-goog-api-key: $GEMINI_API_KEY" \
    -H 'Content-Type: application/json' \
    -d "{
      \"contents\": [{
        \"parts\":[
            {\"text\": \"'Create a picture of my cat eating a nano-banana in a fancy restaurant under the Gemini constellation\"},
            {
              \"inline_data\": {
                \"mime_type\":\"image/jpeg\",
                \"data\": \"$IMG_BASE64\"
              }
            }
        ]
      }]
    }"  \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-edited-image.png
תמונה מ-AI של חתול שאוכל בננה
תמונה שנוצרה על ידי AI של חתול שאוכל בננה ננו

מצבים אחרים של יצירת תמונות

‫Gemini תומך במצבי אינטראקציה אחרים עם תמונות על סמך מבנה ההנחיה וההקשר, כולל:

  • טקסט לתמונה(או לתמונות) וטקסט (משולב): יצירת תמונות עם טקסט שקשור אליהן.
    • הנחיה לדוגמה: "תכין מתכון מאויר לפאייה".
  • תמונה/תמונות וטקסט לתמונה/תמונות וטקסט (משולבים): משתמש בתמונות ובטקסט שמוזנים כדי ליצור תמונות וטקסט חדשים שקשורים אליהם.
    • הנחיה לדוגמה: (עם תמונה של חדר מרוהט) "אילו ספות בצבעים אחרים יתאימו לחלל שלי? אפשר לעדכן את התמונה?"
  • עריכת תמונות בשיחה עם כמה תפניות: אפשר להמשיך ליצור ולערוך תמונות בשיחה.
    • הנחיות לדוגמה: [upload an image of a blue car.] , "הפוך את המכונית הזו למכונית קבריולט", ‫"Now change the color to yellow".

מדריך ואסטרטגיות ליצירת הנחיות

כדי לשלוט ביצירת תמונות באמצעות Gemini 2.5 Flash, צריך להכיר עיקרון בסיסי אחד:

צריך לתאר את הסצנה, לא רק לכלול רשימה של מילות מפתח. החוזקה העיקרית של המודל היא ההבנה העמוקה שלו בשפה. פסקה תיאורית עם נרטיב כמעט תמיד תניב תמונה טובה יותר וקוהרנטית יותר מאשר רשימה של מילים לא קשורות.

הנחיות ליצירת תמונות

השיטות הבאות יעזרו לכם ליצור הנחיות יעילות כדי ליצור בדיוק את התמונות שאתם מחפשים.

1. סצנות פוטוריאליסטיות

כדי ליצור תמונות ריאליסטיות, כדאי להשתמש במונחים מעולם הצילום. כדי להנחות את המודל ליצירת תוצאה פוטוריאליסטית, כדאי לציין זוויות צילום, סוגי עדשות, תאורה ופרטים קטנים.

תבנית

A photorealistic [shot type] of [subject], [action or expression], set in
[environment]. The scene is illuminated by [lighting description], creating
a [mood] atmosphere. Captured with a [camera/lens details], emphasizing
[key textures and details]. The image should be in a [aspect ratio] format.

הנחיה

A photorealistic close-up portrait of an elderly Japanese ceramicist with
deep, sun-etched wrinkles and a warm, knowing smile. He is carefully
inspecting a freshly glazed tea bowl. The setting is his rustic,
sun-drenched workshop. The scene is illuminated by soft, golden hour light
streaming through a window, highlighting the fine texture of the clay.
Captured with an 85mm portrait lens, resulting in a soft, blurred background
(bokeh). The overall mood is serene and masterful. Vertical portrait
orientation.

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents="A photorealistic close-up portrait of an elderly Japanese ceramicist with deep, sun-etched wrinkles and a warm, knowing smile. He is carefully inspecting a freshly glazed tea bowl. The setting is his rustic, sun-drenched workshop with pottery wheels and shelves of clay pots in the background. The scene is illuminated by soft, golden hour light streaming through a window, highlighting the fine texture of the clay and the fabric of his apron. Captured with an 85mm portrait lens, resulting in a soft, blurred background (bokeh). The overall mood is serene and masterful.",
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('photorealistic_example.png')
    image.show()
תקריב פוטוריאליסטי של קדר יפני מבוגר...
תקריב פוטוריאליסטי של קדר יפני מבוגר...

2. איורים וסטיקרים מעוצבים

כדי ליצור סטיקרים, סמלים או נכסים, צריך לציין במפורש את הסגנון ולבקש רקע שקוף.

תבנית

A [style] sticker of a [subject], featuring [key characteristics] and a
[color palette]. The design should have [line style] and [shading style].
The background must be transparent.

הנחיה

A kawaii-style sticker of a happy red panda wearing a tiny bamboo hat. It's
munching on a green bamboo leaf. The design features bold, clean outlines,
simple cel-shading, and a vibrant color palette. The background must be white.

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents="A kawaii-style sticker of a happy red panda wearing a tiny bamboo hat. It's munching on a green bamboo leaf. The design features bold, clean outlines, simple cel-shading, and a vibrant color palette. The background must be white.",
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('red_panda_sticker.png')
    image.show()
סטיקר בסגנון קוואי של תות אדום שמח…
מדבקה בסגנון קאוואי של פנדה אדומה שמחה...

3. טקסט מדויק בתמונות

‫Gemini מצטיין ברינדור טקסט. חשוב לתת הנחיות ברורות לגבי הטקסט, סגנון הגופן (תיאורית) והעיצוב הכללי.

תבנית

Create a [image type] for [brand/concept] with the text "[text to render]"
in a [font style]. The design should be [style description], with a
[color scheme].

הנחיה

Create a modern, minimalist logo for a coffee shop called 'The Daily Grind'.
The text should be in a clean, bold, sans-serif font. The design should
feature a simple, stylized icon of a a coffee bean seamlessly integrated
with the text. The color scheme is black and white.

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents="Create a modern, minimalist logo for a coffee shop called 'The Daily Grind'. The text should be in a clean, bold, sans-serif font. The design should feature a simple, stylized icon of a a coffee bean seamlessly integrated with the text. The color scheme is black and white.",
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('logo_example.png')
    image.show()
תצור לוגו מודרני ומינימליסטי לבית קפה בשם 'The Daily Grind'...
צור לוגו מודרני ומינימליסטי לבית קפה בשם 'The Daily Grind'...

4. מוקאפים של מוצרים וצילום מסחרי

מושלם ליצירת תמונות מוצר נקיות ומקצועיות למסחר אלקטרוני, לפרסום או למיתוג.

תבנית

A high-resolution, studio-lit product photograph of a [product description]
on a [background surface/description]. The lighting is a [lighting setup,
e.g., three-point softbox setup] to [lighting purpose]. The camera angle is
a [angle type] to showcase [specific feature]. Ultra-realistic, with sharp
focus on [key detail]. [Aspect ratio].

הנחיה

A high-resolution, studio-lit product photograph of a minimalist ceramic
coffee mug in matte black, presented on a polished concrete surface. The
lighting is a three-point softbox setup designed to create soft, diffused
highlights and eliminate harsh shadows. The camera angle is a slightly
elevated 45-degree shot to showcase its clean lines. Ultra-realistic, with
sharp focus on the steam rising from the coffee. Square image.

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents="A high-resolution, studio-lit product photograph of a minimalist ceramic coffee mug in matte black, presented on a polished concrete surface. The lighting is a three-point softbox setup designed to create soft, diffused highlights and eliminate harsh shadows. The camera angle is a slightly elevated 45-degree shot to showcase its clean lines. Ultra-realistic, with sharp focus on the steam rising from the coffee. Square image.",
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('product_mockup.png')
    image.show()
תמונת מוצר ברזולוציה גבוהה שצולמה בסטודיו ומציגה ספל קפה קרמי מינימליסטי…
תמונה של מוצר ברזולוציה גבוהה עם תאורה של סטודיו, של ספל קפה מקרמיקה בעיצוב מינימליסטי...

5. עיצוב מינימליסטי עם שטח ריק

אפשר להשתמש בהם כדי ליצור רקעים לאתרים, למצגות או לחומרי שיווק שיוצג עליהם טקסט.

תבנית

A minimalist composition featuring a single [subject] positioned in the
[bottom-right/top-left/etc.] of the frame. The background is a vast, empty
[color] canvas, creating significant negative space. Soft, subtle lighting.
[Aspect ratio].

הנחיה

A minimalist composition featuring a single, delicate red maple leaf
positioned in the bottom-right of the frame. The background is a vast, empty
off-white canvas, creating significant negative space for text. Soft,
diffused lighting from the top left. Square image.

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents="A minimalist composition featuring a single, delicate red maple leaf positioned in the bottom-right of the frame. The background is a vast, empty off-white canvas, creating significant negative space for text. Soft, diffused lighting from the top left. Square image.",
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('minimalist_design.png')
    image.show()
קומפוזיציה מינימליסטית עם עלה מייפל אדום עדין אחד...
קומפוזיציה מינימליסטית עם עלה מייפל אדום אחד ועדין...

6. אומנות עוקבת (פאנל קומיקס / סטוריבורד)

התכונה מתבססת על עקביות הדמויות ותיאור הסצנה כדי ליצור חלוניות לסיפור חזותי.

תבנית

A single comic book panel in a [art style] style. In the foreground,
[character description and action]. In the background, [setting details].
The panel has a [dialogue/caption box] with the text "[Text]". The lighting
creates a [mood] mood. [Aspect ratio].

הנחיה

A single comic book panel in a gritty, noir art style with high-contrast
black and white inks. In the foreground, a detective in a trench coat stands
under a flickering streetlamp, rain soaking his shoulders. In the
background, the neon sign of a desolate bar reflects in a puddle. A caption
box at the top reads "The city was a tough place to keep secrets." The
lighting is harsh, creating a dramatic, somber mood. Landscape.

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents="A single comic book panel in a gritty, noir art style with high-contrast black and white inks. In the foreground, a detective in a trench coat stands under a flickering streetlamp, rain soaking his shoulders. In the background, the neon sign of a desolate bar reflects in a puddle. A caption box at the top reads \"The city was a tough place to keep secrets.\" The lighting is harsh, creating a dramatic, somber mood. Landscape.",
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('comic_panel.png')
    image.show()
חלונית אחת של קומיקס בסגנון אמנותי קשה ונוארי...
חלונית אחת של ספר קומיקס בסגנון אמנותי קשוח של נואר...

הנחיות לעריכת תמונות

בדוגמאות האלה מוסבר איך לספק תמונות לצד הנחיות טקסט לעריכה, לקומפוזיציה ולהעברת סגנון.

1. הוספה והסרה של אלמנטים

מעלים תמונה ומתארים את השינוי. המודל יתאים לסגנון, לתאורה ולפרספקטיבה של התמונה המקורית.

תבנית

Using the provided image of [subject], please [add/remove/modify] [element]
to/from the scene. Ensure the change is [description of how the change should
integrate].

הנחיה

"Using the provided image of my cat, please add a small, knitted wizard hat
on its head. Make it look like it's sitting comfortably and matches the soft
lighting of the photo."

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Base image prompt: "A photorealistic picture of a fluffy ginger cat sitting on a wooden floor, looking directly at the camera. Soft, natural light from a window."
image_input = Image.open('/path/to/your/cat_photo.png')
text_input = """Using the provided image of my cat, please add a small, knitted wizard hat on its head. Make it look like it's sitting comfortably and not falling off."""

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[text_input, image_input],
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('cat_with_hat.png')
    image.show()

קלט

פלט

תמונה פוטו-ריאליסטית של חתול ג’ינג’י פרוותי.
תמונה פוטוריאליסטית של חתול ג'ינג'י פרוותי…
תשתמש בתמונה שסיפקתי של החתול שלי ותוסיף כובע קוסם קטן וסרוג...
Using the provided image of my cat, please add a small, knitted wizard hat...

2. ציור ומחיקה (מסיכה סמנטית)

להגדיר 'מסכה' בשיחה כדי לערוך חלק מסוים בתמונה בלי לשנות את שאר החלקים.

תבנית

Using the provided image, change only the [specific element] to [new
element/description]. Keep everything else in the image exactly the same,
preserving the original style, lighting, and composition.

הנחיה

"Using the provided image of a living room, change only the blue sofa to be
a vintage, brown leather chesterfield sofa. Keep the rest of the room,
including the pillows on the sofa and the lighting, unchanged."

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Base image prompt: "A wide shot of a modern, well-lit living room with a prominent blue sofa in the center. A coffee table is in front of it and a large window is in the background."
living_room_image = Image.open('/path/to/your/living_room.png')
text_input = """Using the provided image of a living room, change only the blue sofa to be a vintage, brown leather chesterfield sofa. Keep the rest of the room, including the pillows on the sofa and the lighting, unchanged."""

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[living_room_image, text_input],
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('living_room_edited.png')
    image.show()

קלט

פלט

צילום רחב של סלון מודרני ומואר היטב…
צילום רחב של סלון מודרני ומואר היטב…
בעזרת התמונה שסיפקת, תשנה רק את הספה הכחולה לספה בסגנון וינטג' מעור חום מסוג צ'סטרפילד...
בעזרת התמונה שסיפקת של הסלון, תשנה רק את הספה הכחולה לספה בסגנון וינטג' מעור חום מסוג צ'סטרפילד...

3. העברת סגנון

מספקים תמונה ומבקשים מהמודל ליצור מחדש את התוכן שלה בסגנון אמנותי אחר.

תבנית

Transform the provided photograph of [subject] into the artistic style of [artist/art style]. Preserve the original composition but render it with [description of stylistic elements].

הנחיה

"Transform the provided photograph of a modern city street at night into the artistic style of Vincent van Gogh's 'Starry Night'. Preserve the original composition of buildings and cars, but render all elements with swirling, impasto brushstrokes and a dramatic palette of deep blues and bright yellows."

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Base image prompt: "A photorealistic, high-resolution photograph of a busy city street in New York at night, with bright neon signs, yellow taxis, and tall skyscrapers."
city_image = Image.open('/path/to/your/city.png')
text_input = """Transform the provided photograph of a modern city street at night into the artistic style of Vincent van Gogh's 'Starry Night'. Preserve the original composition of buildings and cars, but render all elements with swirling, impasto brushstrokes and a dramatic palette of deep blues and bright yellows."""

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[city_image, text_input],
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('city_style_transfer.png')
    image.show()

קלט

פלט

תמונה פוטו-ריאליסטית ברזולוציה גבוהה של רחוב הומה בעיר…
תמונה פוטוריאליסטית ברזולוציה גבוהה של רחוב הומה בעיר...
תשנה את התמונה שצירפתי של רחוב בעיר מודרנית בלילה...
Transform the provided photograph of a modern city street at night...

4. קומפוזיציה מתקדמת: שילוב של כמה תמונות

אפשר לספק כמה תמונות כהקשר כדי ליצור סצנה מורכבת חדשה. האפשרות הזו מושלמת ליצירת מוקאפים של מוצרים או קולאז'ים יצירתיים.

תבנית

Create a new image by combining the elements from the provided images. Take
the [element from image 1] and place it with/on the [element from image 2].
The final image should be a [description of the final scene].

הנחיה

"Create a professional e-commerce fashion photo. Take the blue floral dress
from the first image and let the woman from the second image wear it.
Generate a realistic, full-body shot of the woman wearing the dress, with
the lighting and shadows adjusted to match the outdoor environment."

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Base image prompts:
# 1. Dress: "A professionally shot photo of a blue floral summer dress on a plain white background, ghost mannequin style."
# 2. Model: "Full-body shot of a woman with her hair in a bun, smiling, standing against a neutral grey studio background."
dress_image = Image.open('/path/to/your/dress.png')
model_image = Image.open('/path/to/your/model.png')

text_input = """Create a professional e-commerce fashion photo. Take the blue floral dress from the first image and let the woman from the second image wear it. Generate a realistic, full-body shot of the woman wearing the dress, with the lighting and shadows adjusted to match the outdoor environment."""

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[dress_image, model_image, text_input],
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('fashion_ecommerce_shot.png')
    image.show()

קלט 1

קלט 2

פלט

תמונה מקצועית של שמלת קיץ פרחונית כחולה...
תמונה מקצועית של שמלת קיץ כחולה עם הדפס פרחוני...
תמונה של אישה עם שיער אסוף בגולגול...
תמונה של אישה עם שיער אסוף…
צור תמונה מקצועית של פריט אופנה למסחר אלקטרוני…
צור תמונה מקצועית של פריט אופנה למסחר אלקטרוני...

5. שמירה על פרטים ברמת דיוק גבוהה

כדי לוודא שפרטים חשובים (כמו פנים או לוגו) יישמרו במהלך העריכה, צריך לתאר אותם בפירוט רב יחד עם בקשת העריכה.

תבנית

Using the provided images, place [element from image 2] onto [element from
image 1]. Ensure that the features of [element from image 1] remain
completely unchanged. The added element should [description of how the
element should integrate].

הנחיה

"Take the first image of the woman with brown hair, blue eyes, and a neutral
expression. Add the logo from the second image onto her black t-shirt.
Ensure the woman's face and features remain completely unchanged. The logo
should look like it's naturally printed on the fabric, following the folds
of the shirt."

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Base image prompts:
# 1. Woman: "A professional headshot of a woman with brown hair and blue eyes, wearing a plain black t-shirt, against a neutral studio background."
# 2. Logo: "A simple, modern logo with the letters 'G' and 'A' in a white circle."
woman_image = Image.open('/path/to/your/woman.png')
logo_image = Image.open('/path/to/your/logo.png')
text_input = """Take the first image of the woman with brown hair, blue eyes, and a neutral expression. Add the logo from the second image onto her black t-shirt. Ensure the woman's face and features remain completely unchanged. The logo should look like it's naturally printed on the fabric, following the folds of the shirt."""

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[woman_image, logo_image, text_input],
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('woman_with_logo.png')
    image.show()

קלט 1

קלט 2

פלט

תמונה מקצועית לקורות חיים של אישה עם שיער חום ועיניים כחולות…
A professional headshot of a woman with brown hair and blue eyes...
לוגו פשוט ומודרני עם האותיות G ו-A...
לוגו פשוט ומודרני עם האותיות G ו-A...
צלם את התמונה הראשונה של האישה עם שיער חום, עיניים כחולות והבעה ניטרלית...
צלם את התמונה הראשונה של האישה עם שיער חום, עיניים כחולות והבעה ניטרלית...

שיטות מומלצות

כדי לשפר את התוצאות שלכם מרמה טובה לרמה מצוינת, כדאי לשלב את האסטרטגיות המקצועיות האלה בתהליך העבודה.

  • להיות ספציפיים מאוד: ככל שתספקו יותר פרטים, כך תהיה לכם יותר שליטה. במקום "שריון פנטזיה", תתארו אותו: "שריון לוחות אלפיני מעוטר, עם דוגמאות של עלי כסף חרוטים, צווארון גבוה ומגיני כתפיים בצורת כנפי בז".
  • מספקים הקשר וכוונת שימוש: מסבירים את המטרה של התמונה. ההבנה של המודל לגבי ההקשר תשפיע על הפלט הסופי. לדוגמה, התוצאות של ההנחיה "צור לוגו למותג טיפוח עור יוקרתי ומינימליסטי" יהיו טובות יותר מהתוצאות של ההנחיה "צור לוגו".
  • חזרה על הפעולה ושיפור: אל תצפו לקבל תמונה מושלמת בניסיון הראשון. אפשר להשתמש באופי השיחתי של המודל כדי לבצע שינויים קטנים. אפשר להוסיף הנחיות כמו "זה נהדר, אבל אפשר לשנות את התאורה כך שתהיה חמימה יותר?" או "תשאיר את הכול כמו שזה, אבל תשנה את הבעת הפנים של הדמות כך שתהיה רצינית יותר".
  • שימוש בהוראות מפורטות: בסצנות מורכבות עם הרבה אלמנטים, כדאי לחלק את ההנחיה לשלבים. "קודם כול, תיצור רקע של יער שקט ומעורפל עם שחר. אחר כך, בחזית, מוסיפים מזבח אבן עתיק מכוסה טחב. לבסוף, מניחים חרב אחת זוהרת על המזבח".
  • משתמשים בהנחיות שליליות סמנטיות: במקום לכתוב "אין מכוניות", מתארים את הסצנה הרצויה בצורה חיובית: "רחוב ריק ושומם ללא סימני תנועה".
  • שליטה במצלמה: שימוש בשפה צילומית וקולנועית כדי לשלוט בקומפוזיציה. מונחים כמו wide-angle shot, macro shot, low-angle perspective.

מגבלות

  • כדי להשיג את הביצועים הטובים ביותר, מומלץ להשתמש בשפות הבאות: EN, es-MX, ja-JP, zh-CN, hi-IN.
  • אי אפשר להשתמש בקלט של אודיו או וידאו כדי ליצור תמונות.
  • המודל לא תמיד יפיק בדיוק את מספר התמונות שהמשתמש ביקש במפורש.
  • המודל פועל בצורה הטובה ביותר עם עד 3 תמונות כקלט.
  • כשיוצרים טקסט לתמונה, מומלץ קודם ליצור את הטקסט ואז לבקש תמונה עם הטקסט.
  • בשלב הזה אי אפשר להעלות תמונות של ילדים באזור הכלכלי האירופי, בשווייץ ובבריטניה.
  • כל התמונות שנוצרות על ידי AI כוללות סימן מים של SynthID.

מתי כדאי להשתמש ב-Imagen

בנוסף ליכולות המובנות של Gemini ליצירת תמונות, אתם יכולים לגשת גם אל Imagen, המודל המיוחד שלנו ליצירת תמונות, דרך Gemini API.

מאפיין Imagen תמונה מותאמת של Gemini
נקודות חוזק מודל יצירת התמונות הכי מתקדם עד היום. מומלץ לתמונות פוטוריאליסטיות, לחדות טובה יותר, לאיות ולטיפוגרפיה משופרים. ההמלצה שמוגדרת כברירת מחדל.
גמישות שאין שנייה לה, הבנה הקשרית ועריכה פשוטה ללא מסכות. יכולות ייחודיות של עריכה בשיחה עם כמה תפניות.
זמינות זמינות לכלל המשתמשים (GA) תצוגה מקדימה (מותר שימוש בסביבת ייצור)
זמן אחזור נמוכה. אופטימיזציה לביצועים כמעט בזמן אמת. גבוה יותר. היכולות המתקדמות שלו דורשות יותר חישובים.
עלות פתרון חסכוני למשימות ספציפיות. ‫0.02$ לתמונה עד 0.12 $לתמונה תמחור מבוסס-טוקנים. ‫30$ למיליון טוקנים עבור פלט של תמונות (פלט של תמונות שעבר טוקניזציה בשיעור קבוע של 1,290 טוקנים לכל תמונה, עד ‎1,024x1,024px)
משימות מומלצות
  • העדיפות העליונה היא לאיכות התמונה, לריאליזם, לפרטים אומנותיים או לסגנונות ספציפיים (למשל, אימפרסיוניזם, אנימה).
  • הוספת מיתוג, סגנון או יצירת סמלי לוגו ועיצובים של מוצרים.
  • יצירת איות או טיפוגרפיה מתקדמים.
  • יצירת תוכן שמשלב תמונות וטקסט בצורה חלקה.
  • לשלב אלמנטים קריאייטיביים מכמה תמונות באמצעות הנחיה אחת.
  • לערוך תמונות בצורה ספציפית מאוד, לשנות רכיבים בודדים באמצעות פקודות פשוטות בשפה טבעית ולעבוד על תמונה באופן איטרטיבי.
  • אפשר להחיל עיצוב או מרקם ספציפיים מתמונה אחת על תמונה אחרת, תוך שמירה על הצורה והפרטים של הנושא המקורי.

מודל Imagen 4 הוא המודל המומלץ ליצירת תמונות באמצעות Imagen. כדאי לבחור ב-Imagen 4 Ultra לתרחישי שימוש מתקדמים או כשרוצים את איכות התמונה הכי טובה (שימו לב שאפשר ליצור רק תמונה אחת בכל פעם).

המאמרים הבאים