Crea imágenes con IA gratis usando Google Bard Gemini Pro

Crea imágenes con IA gratis usando Google Bard Gemini Pro

Con Gemini Pro en Google Bard, ahora puedes crear imágenes AI gratis. Descubre cómo funciona y una comparativa con Dall-E 3, Midjourney V6 y Adobe Firefly 2.

La creación de imágenes de inteligencia artificial es parte de nuestro presente y mucho mejor si se puede hacer gratis. Ahora que estamos acostumbrados a pagar por Midjourney V6, Dall-E 3 (en ChatGPT Plus) o Adobe Firefly 2 (para imágenes sin marcas de agua), Google ofrece desde el 1 de febrero de 2024 una forma realmente gratuita de crear imágenes AI decentes, y en bastante buena calidad:

  • bastante buena calidad,
  • en una interfaz de usuario agradable,
  • y sin complicadas indicaciones.

Google Bard lo hace posible, gracias a Google Images AI Gemini Pro. Te muestro cómo funciona todo, lo que necesitas saber, y la comparativa con Midjourney V6, Adobe Firefly 2 y Dall-E 3.

Cómo usar Google Bard Gemini Pro

Gemini Pro ya está disponible en Google Bard en muchos países. Para crear imágenes AI gratuitas con él, basta con ir a bard.google.com. Todo lo que necesitas es una cuenta de Google.

En España con VPN

Aunque el anuncio de Google afirma que la IA está disponible en «casi todos los países», lamentablemente en España no.

Bard en España a día de hoy (8 de febrero de 2024) no crea imágenes.
Bard en España a día de hoy (8 de febrero de 2024) no crea imágenes.

Sin embargo, si enrutas tu conexión a Internet con una herramienta VPN a través de un país como Estados Unidos, puedes utilizar la función. Yo de hace innumerables año uso personalVPN de WITOPIA* para esto.

Una vez establecida la conexión VPN, puedes crear una imagen inicial de IA en Google Bard mediante una sencilla pregunta en inglés.

Eso si: en Estados Unidos bard.google.com redirige a gemini.google.com:

En Estados Unidos bard.google.com redirige a gemini.google.com

Por ejemplo, empieza por crear una imagen (create an image) o simplemente escribe lo que tengas en mente:

Para ser una primera prueba y un mensaje de 8 palabras, no está nada mal. Sin duda, la primera de las imágenes de la IA podría confundirse con una foto:

Lo que hay que tener en cuenta con las imágenes AI de Google Bard

Google Bard Gemini Pro no está a la altura de Midjourney o Adobe Firefly por el momento (ejemplos más abajo), pero es completamente gratuito y actualmente se puede utilizar indefinidamente. Esto significa que puedes crear un número ilimitado de imágenes AI de forma realmente gratuita, y además con bastante rapidez. Sin embargo, hay algunas cosas que debes saber sobre la creación de imágenes de IA con Google Bard.

Las imágenes de Google Bard Gemini Pro tienen una marca de agua invisible

Google Bard utiliza la tecnología SynthID para crear marcas de agua invisibles e incrustarlas en cada imagen. Esta tecnología no es totalmente nueva, pero supone una auténtica ganancia en seguridad. Digimarc, por ejemplo, lleva utilizando marcas de agua invisibles desde los primeros tiempos de Photoshop. Desde entonces, nuevas empresas tecnológicas como steg.ai han ampliado y mejorado este sistema.

Las marcas de agua invisibles se crean utilizando software para cambiar los píxeles de la imagen de modo que sean invisibles para los humanos. Los ajustes siguen un patrón que debe permanecer en su sitio aunque se manipule la imagen. Los patrones no se almacenan en los metadatos de la imagen, sino que se incrustan en los píxeles de la propia imagen.

Esta tecnología es especialmente útil para proteger los derechos de autor y de imagen o para detectar falsificaciones o deepfakes. En cualquier caso, desde el punto de vista de Google, se puede rastrear en cualquier momento el camino hasta el origen (el creador, es decir, Google Bard Gemini Pro).

De este modo, Gemini Pro se convierte en el primer «gran» generador gratuito de imágenes de IA que utiliza esta tecnología. En el futuro, Google no sólo serás capaz de reconocer las imágenes de IA gratuitas, sino que también podría tenerlas en cuenta en su algoritmo. Queda por ver si esto afectará a los esfuerzos de SEO y de qué manera. Y también está por ver si las imágenes de los resultados de búsqueda se marcarán automáticamente como generadas por IA en el futuro.

Google Bard es estricto y da prioridad a la seguridad

Otra desventaja (o ventaja) es que Google Bard sigue unas normas éticas bastante estrictas y da prioridad a la protección de la privacidad de forma mucho más estricta que Midjourney o Dall-E, por ejemplo.

Dall-E, por ejemplo, se niega a crear imágenes ofensivas, pero no tiene ningún problema en crear imágenes de personajes públicos conocidos.

Midjourney va un paso más allá. Aquí, las personas también pueden transformarse en cómics u otros estilos, por ejemplo.

Google, por su parte, no sólo protege a las personas, sino que también intenta evitar cualquier cosa que pueda utilizarse en un contexto moralmente cuestionable.

Por ejemplo, si le pides a Bard que cree una imagen de un agente de policía enfrentándose a una multitud de manifestantes. Google se niega porque podría representar violencia o conflictos entre personas.

Si le pides a Bard que cree una imagen de un agente de policía enfrentándose a una multitud de manifestantes. Google se niega porque podría representar violencia o conflictos entre personas.

O si le pides «chicas guapas» en la playa en Valencia tampoco le gusta:

Si le pides "chicas guapas" en la playa en Valencia a Bard/Gemini tampoco le gusta.

Por cierto esto es lo que responde Midjourney:

/imagine a beach in valencia (spain) with beautiful girls –v 6.0 –style raw –aspect 3:2

Bard/Gemini ni siquiera quiere crear chicas:

Si le pides solo "chicas" en la playa en Valencia a Bard/Gemini tampoco le gusta.

Pero si chicas que juegan al volley:

Aunque algunas personas puedan sentir restringida su creatividad, parece una norma sensata que sólo puede ser buena para el mundo en la situación actual. Por cierto, Google ha establecido las normas en los principios de diseño de Google acerca de IA y no sólo se aplican a las imágenes.

Google Bard es rápido y sólo genera 2 imágenes (o una)

En comparación con muchos otros generadores de imágenes AI, Google Bard sólo genera dos imágenes (a veces sólo una) en la primera ejecución.

  • dos imágenes (a veces sólo una)
  • en formato cuadrado
  • y en tamaño miniatura.

Si abres la miniatura y haces clic en Descargar original (haz clic en el icono de descarga de la parte superior derecha), se descarga una imagen en formato .jpeg con un tamaño aproximado de 600 KB y unas dimensiones de 1536 x 1536 px. En las pruebas no se ha podido cambiar el formato de salida (por ejemplo, a 3:2).

Esto es suficiente para su uso en la web. Si quieres hacer más (imprimir), llegarás a tus límites aquí.

¿Qué calidad tienen las imágenes de la IA de Google Bard en comparación con otras?

Para comprobarlo aquí hay una comparativa de la IA de imágenes gratuita de Google con la de los competidores más potentes, con distintas instrucciones y escenarios de imágenes (comida, personas, paisajes):

  • Dall-E 3
  • Midjourney V6
  • Adobe Firefly 2

El objetivo es crear imágenes fotorrealistas.

Vale la pena mencionar que, a excepción de Google Bard, todas las ofertas valen dinero. Con Adobe Firefly puedes crear hasta 25 imágenes al mes gratis si aceptas una marca de agua. Después, Firefly cuesta 5,49 euros al mes, lo que lo convierte en el servicio de pago más barato de la comparativa (Midjourney cuesta al menos 10 dólares al mes).

Ejemplo de una imagen de: Comida

En este ejemplo se ha usado este prompt:

Food Photography of a creamy tomato soup. The tomato soup comes with a swirl of fresh joghurt sitting in the middle of the bowl, topped with crispy fried tofu bites and a sprinkle of basil, a bowl of fresh tomatos on the left, basil herbs on the right. High angle shot inspired by editorial food photography.

Aquí están los resultados:

Google Gemini / Bard - Food
Google Gemini / Bard
ChatGPT / Dall-E 3 - Food
ChatGPT / Dall-E 3
Adobe Firefly - Food
Adobe Firefly
Midjourney - Food
Midjourney

Lo más destacado:

  • Dall-E 3 es la más antinatural, Firefly la más natural.
  • Midjourney es el que mejor maneja la información espacial en la colocación.
  • Bard y Midjourney utilizan el brillo de la luz para crear naturalidad.

Ejemplo de una imagen de: Persona

En este ejemplo se ha usado este prompt:

A portrait of a 25-year-old woman with short, blonde hair and a jumpsuit, standing at a pier in a harbour, golden hour, soft color.

Aquí están los resultados:

Google Gemini / Bard - Person
Google Gemini / Bard
ChatGPT / Dall-E 3 - Person
ChatGPT / Dall-E 3
Adobe Firefly - Person
Adobe Firefly
Midjourney - Person
Midjourney

Lo más destacado:

  • Al parecer, Adobe Firefly utiliza una plantilla de su propia base de datos de fotos de archivo (en general, una ventaja de Firefly, ya que es legalmente seguro bajo la ley de licencias).
  • Todos han entendido el humor, pero Midjourney es el más convincente
  • Dall-E 3 es de nuevo la única IA que produce una imagen que no parece natural

Ejemplo de una imagen de: Paisaje

En este ejemplo se ha usado este prompt:

A bird’s eye view medium shot of a snowy Canadian woodland landscape, blanketed in fresh, pristine snow, the trees standing silent and majestic, under the clear blue sky of a crisp winter morning, shot with a DJI Mavic Air 2, wide angle, vibrant colors with cool blue and white tones

Aquí están los resultados:

Google Gemini / Bard - Landscape
Google Gemini / Bard
ChatGPT / Dall-E 3 - Landscape
ChatGPT / Dall-E 3
Adobe Firefly - Landscape
Adobe Firefly
Midjourney - Landscape
Midjourney

Lo más destacado:

  • Las herramientas entendieronbien el estilo de rodaje con drones.
  • Dall-E 3 vuelve a parecer nada natural.

El veredicto sobre Google Bard Gemini Pro (9 de febrero de 2024)

La generación de imágenes con IA de forma gratuita de Google impresiona. Puede que la calidad de imagen aún no esté siempre a la altura y que siga por detrás de Midjourney V6 en particular, pero la carrera está reñida y lejos de decidirse. Y no hay que olvidar que es gratis y puedes generar todas las imágenes que quieras.

Si quieres crear imágenes AI comercialmente de forma «segura» y garantizada sin infringir los derechos de autor, te recomendaría Adobe Firefly.

¿Quieres saber más sobre la inteligencia artificial generativa? En DQS/ te asesoramos. ¿Por qué no nos preguntas cómo podemos ayudarte?

Este post está basado en el artículo «KI Bilder kostenlos erstellen: So gut ist das neue Google Bard Gemini Pro» publicado en alemán por LSWW Let’ See What Works. Aquí están las normas en los principios de diseño de Google acerca de IA.

* El enlace de personalVPN de WITOPIA es un enlace de afiliado a través del cual, y por las compras adscritas que cumplan los requisitos aplicables, pueden obtenerse ingresos para consultor365.com sin que esto suponga un sobrecoste para el comprador.

Publicaciones Similares

¿Te ha parecido interesante? ¿Tienes dudas sobre el contenido?
Para cualquier pregunta ponte en contacto conmigo.