Firebase is back at Google I/O on May 20-21! Register now.

Ta strona została przetłumaczona przez Cloud Translation API.

Strumieniowanie dwukierunkowe za pomocą interfejsu Gemini Live API
Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

Gemini Live API umożliwia dwukierunkowe interakcje z użyciem tekstu i głosu z urządzeniem Gemini z niewielkim opóźnieniem. Dzięki Live API możesz zapewnić użytkownikom naturalne, ludzkie rozmowy z możliwością przerywania odpowiedzi modelu za pomocą poleceń tekstowych lub głosowych. Model może przetwarzać tekst i dźwięk (wkrótce udostępnimy też opcję wideo) oraz generować tekst i dźwięk.

Możesz tworzyć prototypy z promptami i funkcją Live API w Vertex AI Studio.

Interfejs Live API to interfejs API ze stanem, który tworzy połączenie WebSocket, aby nawiązać sesję między klientem a serwerem Gemini. Szczegółowe informacje znajdziesz w dokumentacji referencyjnej Live API.

Zanim zaczniesz

Jeśli jeszcze tego nie zrobiono, przeczytaj przewodnik dla początkujących, w którym znajdziesz instrukcje konfigurowania projektu Firebase, łączenia aplikacji z Firebase, dodawania pakietu SDK, inicjowania usługi Vertex AI i tworzenia wystąpienia LiveModel.

Upewnij się, że używasz co najmniej tych wersji bibliotek Firebase:
iOS+: nieobsługiwane | Android: wersja 16.3.0 lub nowsza (BoM: wersja 33.12.0 lub nowsza) | Sieć: nieobsługiwane | Flutter: wersja 1.5.0 lub nowsza (BoM: wersja 3.9.0 lub nowsza)

Modele, które obsługują tę funkcję

Funkcja Live API jest obsługiwana tylko przez gemini-2.0-flash-live-preview-04-09 (nie przez gemini-2.0-flash).

Korzystanie ze standardowych funkcji usługi Live API

Z tej sekcji dowiesz się, jak korzystać ze standardowych funkcji Live API, w szczególności do przesyłania strumieniowego różnych typów danych wejściowych i wyjściowych:

Wysyłanie i odbieranie SMS-ów
Wysyłanie i odbieranie dźwięku
Wysyłanie dźwięku i odbieranie tekstu
Wysyłanie tekstu i odbieranie dźwięku

Wysyłanie i odbieranie SMS-ów

Możesz wysyłać strumieniowe dane wejściowe tekstowe i otrzymywać strumieniowe dane wyjściowe tekstowe. Utwórz instancję liveModel i ustaw tryb odpowiedzi na Text.

Swift

Live API nie jest jeszcze obsługiwany w przypadku aplikacji na platformę Apple, ale wkrótce się to zmieni.

Kotlin

// Initialize the Vertex AI service and create a `LiveModel` instance
val model = Firebase.vertexAI.liveModel(
    // The Live API requires this specific model.
    modelName = "gemini-2.0-flash-live-preview-04-09",
    // Configure the model to respond with text
    generationConfig = liveGenerationConfig {
        responseModality = ResponseModality.TEXT 
   }
)

val session = model.connect()

// Provide a text prompt
val text = "tell a short story"

session.send(text)

var outputText = ""
session.receive().collect {
    if(it.status == Status.TURN_COMPLETE) {
        // Optional: if you don't require to send more requests.
        session.stopReceiving();
    }
    outputText = outputText + it.text
}

// Output received from the server.
println(outputText)

Java

ExecutorService executor = Executors.newFixedThreadPool(1);
// Initialize the Vertex AI service and create a `LiveModel` instance
LiveGenerativeModel lm = FirebaseVertexAI.getInstance().liveModel(
        // The Live API requires this specific model.
        "gemini-2.0-flash-live-preview-04-09",
        // Configure the model to respond with text
        new LiveGenerationConfig.Builder()
                .setResponseModalities(ResponseModality.TEXT)
                .build()
);
LiveModelFutures model = LiveModelFutures.from(lm);
ListenableFuture<LiveSession> sessionFuture =  model.connect();
class LiveContentResponseSubscriber implements Subscriber<LiveContentResponse> {
    @Override
    public void onSubscribe(Subscription s) {
        s.request(Long.MAX_VALUE); // Request an unlimited number of items
    }
    @Override
    public void onNext(LiveContentResponse liveContentResponse) {
       // Handle the response from the server.
	System.out.println(liveContentResponse.getText());
    }
    @Override
    public void onError(Throwable t) {
        System.err.println("Error: " + t.getMessage());
    }
    @Override
    public void onComplete() {
        System.out.println("Done receiving messages!");
    }
}
Futures.addCallback(sessionFuture, new FutureCallback<LiveSession>() {
    @Override
    public void onSuccess(LiveSession ses) {
	  LiveSessionFutures session = LiveSessionFutures.from(ses);
        // Provide a text prompt
        String text = "tell me a short story?";
        session.send(text);
        Publisher<LiveContentResponse> publisher = session.receive();
        publisher.subscribe(new LiveContentResponseSubscriber());
    }
    @Override
    public void onFailure(Throwable t) {
        // Handle exceptions
    }
}, executor);

Web

Live API nie jest jeszcze obsługiwany w przypadku aplikacji internetowych, ale wkrótce się to zmieni.

Dart

import 'package:firebase_vertexai/firebase_vertexai.dart';
import 'package:firebase_core/firebase_core.dart';
import 'firebase_options.dart';

late LiveModelSession _session;

await Firebase.initializeApp(
  options: DefaultFirebaseOptions.currentPlatform,
);

// Initialize the Vertex AI service and create a `LiveModel` instance
final model = FirebaseVertexAI.instance.liveModel(
  // The Live API requires this specific model.
  model: 'gemini-2.0-flash-live-preview-04-09',
  // Configure the model to respond with text
  config: LiveGenerationConfig(responseModalities: [ResponseModality.text]),
);

_session = await model.connect();

// Provide a text prompt
final prompt = Content.text('tell a short story');
await _session.send(input: prompt, turnComplete: true);

// In a separate thread, receive the response
await for (final message in _session.receive()) {
   // Process the received message 
}

Dowiedz się, jak wybrać model i opcjonalnie lokalizację odpowiednią do przypadku użycia i aplikacji.

Wysyłanie i odbieranie dźwięku

Możesz wysyłać strumieniowe dane wejściowe audio i odbierać strumieniowe dane wyjściowe audio. Utwórz instancję LiveModel i ustaw tryb odpowiedzi na Audio.

Dowiedz się, jak skonfigurować i dostosowywać głos odpowiedzi (poniżej).

Swift

Live API nie jest jeszcze obsługiwany w przypadku aplikacji na platformę Apple, ale wkrótce się to zmieni.

Kotlin

// Initialize the Vertex AI service and create a `LiveModel` instance
val model = Firebase.vertexAI.liveModel(
    // The Live API requires this specific model.
    modelName = "gemini-2.0-flash-live-preview-04-09",
    // Configure the model to respond with text
    generationConfig = liveGenerationConfig {
        responseModality = ResponseModality.AUDIO 
   }
)

val session = model.connect()

// This is the recommended way.
// However, you can create your own recorder and handle the stream.
session.startAudioConversation()

Java

ExecutorService executor = Executors.newFixedThreadPool(1);
// Initialize the Vertex AI service and create a `LiveModel` instance
LiveGenerativeModel lm = FirebaseVertexAI.getInstance().liveModel(
        // The Live API requires this specific model.
        "gemini-2.0-flash-live-preview-04-09",
        // Configure the model to respond with text
        new LiveGenerationConfig.Builder()
                .setResponseModalities(ResponseModality.TEXT)
                .build()
);
LiveModelFutures model = LiveModelFutures.from(lm);
ListenableFuture<LiveSession> sessionFuture =  model.connect();

Futures.addCallback(sessionFuture, new FutureCallback<LiveSession>() {
    @Override
    public void onSuccess(LiveSession ses) {
	 LiveSessionFutures session = LiveSessionFutures.from(ses);
        session.startAudioConversation();
    }
    @Override
    public void onFailure(Throwable t) {
        // Handle exceptions
    }
}, executor);

Sieć

Live API nie jest jeszcze obsługiwany w przypadku aplikacji internetowych, ale wkrótce się to zmieni.

Dart

import 'package:firebase_vertexai/firebase_vertexai.dart';
import 'package:firebase_core/firebase_core.dart';
import 'firebase_options.dart';
import 'package:your_audio_recorder_package/your_audio_recorder_package.dart';

late LiveModelSession _session;
final _audioRecorder = YourAudioRecorder();

await Firebase.initializeApp(
  options: DefaultFirebaseOptions.currentPlatform,
);

// Initialize the Vertex AI service and create a `LiveModel` instance
final model = FirebaseVertexAI.instance.liveModel(
  // The Live API requires this specific model.
  model: 'gemini-2.0-flash-live-preview-04-09',
   // Configure the model to respond with audio
   config: LiveGenerationConfig(responseModalities: [ResponseModality.audio]),
);

_session = await model.connect();

final audioRecordStream = _audioRecorder.startRecordingStream();
// Map the Uint8List stream to InlineDataPart stream
final mediaChunkStream = audioRecordStream.map((data) {
  return InlineDataPart('audio/pcm', data);
});
await _session.startMediaStream(mediaChunkStream);

// In a separate thread, receive the audio response from the model
await for (final message in _session.receive()) {
   // Process the received message 
}

Dowiedz się, jak wybrać model i opcjonalnie lokalizację odpowiednią do przypadku użycia i aplikacji.

Wysyłanie dźwięku i odbieranie tekstu

Możesz wysyłać strumieniowe dane wejściowe w postaci dźwięku i otrzymywać strumieniowy tekst wyjściowy. Utwórz instancję LiveModel i ustaw tryb odpowiedzi na Text.

Swift

Live API nie jest jeszcze obsługiwany w przypadku aplikacji na platformy Apple, ale zaglądaj tu wkrótce.

Kotlin

// Initialize the Vertex AI service and create a `LiveModel` instance
val model = Firebase.vertexAI.liveModel(
    // The Live API requires this specific model.
    modelName = "gemini-2.0-flash-live-preview-04-09",
    // Configure the model to respond with text
    generationConfig = liveGenerationConfig {
        responseModality = ResponseModality.TEXT 
   }
)

val session = model.connect()

// Provide a text prompt
val audioContent = content("user") { audioData }

session.send(audioContent)

var outputText = ""
session.receive().collect {
    if(it.status == Status.TURN_COMPLETE) {
        // Optional: if you don't require to send more requests.
        session.stopReceiving();
    }
    outputText = outputText + it.text
}

// Output received from the server.
println(outputText)

Java

TODO - snippet ExecutorService executor = Executors.newFixedThreadPool(1);
// Initialize the Vertex AI service and create a `LiveModel` instance
LiveGenerativeModel lm = FirebaseVertexAI.getInstance().liveModel(
        // The Live API requires this specific model.
        "gemini-2.0-flash-live-preview-04-09",
        // Configure the model to respond with text
        new LiveGenerationConfig.Builder()
                .setResponseModalities(ResponseModality.TEXT)
                .build()
);
LiveModelFutures model = LiveModelFutures.from(lm);
ListenableFuture<LiveSession> sessionFuture =  model.connect();
class LiveContentResponseSubscriber implements Subscriber<LiveContentResponse> {
    @Override
    public void onSubscribe(Subscription s) {
        s.request(Long.MAX_VALUE); // Request an unlimited number of items
    }
    @Override
    public void onNext(LiveContentResponse liveContentResponse) {
        // Handle the response from the server.
	System.out.println(liveContentResponse.getText());
    }
    @Override
    public void onError(Throwable t) {
        System.err.println("Error: " + t.getMessage());
    }
    @Override
    public void onComplete() {
        System.out.println("Done receiving messages!");
    }
}
Futures.addCallback(sessionFuture, new FutureCallback<LiveSession>() {
    @Override
    public void onSuccess(LiveSession ses) {
	 LiveSessionFutures session = LiveSessionFutures.from(ses);
        // Send Audio data
	 session.send(new Content.Builder().addInlineData(audioData, "audio/pcm").build());

        session.send(text);
        Publisher<LiveContentResponse> publisher = session.receive();
        publisher.subscribe(new LiveContentResponseSubscriber());
    }
    @Override
    public void onFailure(Throwable t) {
        // Handle exceptions
    }
}, executor);

Web

Live API nie jest jeszcze obsługiwany w przypadku aplikacji internetowych, ale wkrótce się to zmieni.

Dart

import 'package:firebase_vertexai/firebase_vertexai.dart';
import 'package:firebase_core/firebase_core.dart';
import 'firebase_options.dart';
import 'package:your_audio_recorder_package/your_audio_recorder_package.dart';
import 'dart:async';

late LiveModelSession _session;
final _audioRecorder = YourAudioRecorder();

await Firebase.initializeApp(
  options: DefaultFirebaseOptions.currentPlatform,
);

final model = FirebaseVertexAI.instance.liveModel(
  model: 'gemini-2.0-flash-live-preview-04-09',
  config: LiveGenerationConfig(responseModality: ResponseModality.text),
);

_session = await model.connect();

final audioRecordStream = _audioRecorder.startRecordingStream();
final mediaChunkStream = audioRecordStream.map((data) {
  return InlineDataPart('audio/pcm', data);
});

await _session.startMediaStream(mediaChunkStream);

final responseStream = _session.receive();

return responseStream.asyncMap((response) async {
  if (response.parts.isNotEmpty && response.parts.first.text != null) {
    return response.parts.first.text!;
  } else {
    throw Exception('Text response not found.');
  }
});

Future main() async {
  try {
    final textStream = await audioToText();

    await for (final text in textStream) {
      print('Received text: $text');
      // Handle the text response
    }
  } catch (e) {
    print('Error: $e');
  }
}

Dowiedz się, jak wybrać model i opcjonalnie lokalizację odpowiednią do przypadku użycia i aplikacji.

Wysyłanie tekstu i odbieranie dźwięku

Możesz wysyłać strumieniowe dane tekstowe i otrzymywać strumieniowe dane wyjściowe w postaci dźwięku. Utwórz instancję LiveModel i ustaw tryb odpowiedzi na Audio.

Dowiedz się, jak skonfigurować i dostosowywać głos odpowiedzi (poniżej).

Swift

Live API nie jest jeszcze obsługiwany w przypadku aplikacji na platformę Apple, ale wkrótce się to zmieni.

Kotlin

// Initialize the Vertex AI service and create a `LiveModel` instance
val model = Firebase.vertexAI.liveModel(
    // The Live API requires this specific model.
    modelName = "gemini-2.0-flash-live-preview-04-09",
    // Configure the model to respond with text
    generationConfig = liveGenerationConfig {
        responseModality = ResponseModality.AUDIO
   }
)

val session = model.connect()

// Provide a text prompt
val text = "tell a short story"

session.send(text)

session.receive().collect {
    if(it.status == Status.TURN_COMPLETE) {
        // Optional: if you don't require to send more requests.
        session.stopReceiving();
    }
    // Handle 16bit pcm audio data at 24khz
    playAudio(it.data)
}

Java

ExecutorService executor = Executors.newFixedThreadPool(1);
// Initialize the Vertex AI service and create a `LiveModel` instance
LiveGenerativeModel lm = FirebaseVertexAI.getInstance().liveModel(
        // The Live API requires this specific model.
        "gemini-2.0-flash-live-preview-04-09",
        // Configure the model to respond with text
        new LiveGenerationConfig.Builder()
                .setResponseModalities(ResponseModality.AUDIO)
                .build()
);
LiveModelFutures model = LiveModelFutures.from(lm);
ListenableFuture<LiveSession> sessionFuture =  model.connect();
class LiveContentResponseSubscriber implements Subscriber<LiveContentResponse> {
    @Override
    public void onSubscribe(Subscription s) {
        s.request(Long.MAX_VALUE); // Request an unlimited number of items
    }
    @Override
    public void onNext(LiveContentResponse liveContentResponse) {
        // Handle 16bit pcm audio data at 24khz
	liveContentResponse.getData();
    }
    @Override
    public void onError(Throwable t) {
        System.err.println("Error: " + t.getMessage());
    }
    @Override
    public void onComplete() {
        System.out.println("Done receiving messages!");
    }
}
Futures.addCallback(sessionFuture, new FutureCallback<LiveSession>() {
    @Override
    public void onSuccess(LiveSession ses) {
	 LiveSessionFutures session = LiveSessionFutures.from(ses);
        // Provide a text prompt
        String text = "tell me a short story?";
        session.send(text);
        Publisher<LiveContentResponse> publisher = session.receive();
        publisher.subscribe(new LiveContentResponseSubscriber());
    }
    @Override
    public void onFailure(Throwable t) {
        // Handle exceptions
    }
}, executor);

Web

Live API nie jest jeszcze obsługiwany w przypadku aplikacji internetowych, ale wkrótce się to zmieni.

Dart

import 'package:firebase_vertexai/firebase_vertexai.dart';
import 'package:firebase_core/firebase_core.dart';
import 'firebase_options.dart';
import 'dart:async';
import 'dart:typed_data';

late LiveModelSession _session;

Future<Stream<Uint8List>> textToAudio(String textPrompt) async {
  WidgetsFlutterBinding.ensureInitialized();

  await Firebase.initializeApp(
    options: DefaultFirebaseOptions.currentPlatform,
  );

  final model = FirebaseVertexAI.instance.liveModel(
    model: 'gemini-2.0-flash-live-preview-04-09',
    config: LiveGenerationConfig(responseModality: ResponseModality.audio),
  );

  _session = await model.connect();

  final prompt = Content.text(textPrompt);

  await _session.send(input: prompt);

  return _session.receive().asyncMap((response) async {
    if (response is LiveServerContent && response.modelTurn?.parts != null) {
       for (final part in response.modelTurn!.parts) {
         if (part is InlineDataPart) {
           return part.bytes;
         }
       }
    }
    throw Exception('Audio data not found');
  });
}

Future<void> main() async {
  try {
    final audioStream = await textToAudio('Convert this text to audio.');

    await for (final audioData in audioStream) {
      // Process the audio data (e.g., play it using an audio player package)
      print('Received audio data: ${audioData.length} bytes');
      // Example using flutter_sound (replace with your chosen package):
      // await _flutterSoundPlayer.startPlayer(fromDataBuffer: audioData);
    }
  } catch (e) {
    print('Error: $e');
  }
}

Dowiedz się, jak wybrać model i opcjonalnie lokalizację odpowiednią do przypadku użycia i aplikacji.

Twórz bardziej angażujące i interaktywne treści

W tej sekcji opisaliśmy, jak tworzyć bardziej angażujące lub interaktywne funkcje Live API i nimi zarządzać.

Zmiana głosu w odpowiedzi

Live API korzysta z Chirp 3 do obsługi odpowiedzi głosowych. Korzystając z Vertex AI in Firebase, możesz wysyłać dźwięk w 5 głosach HD i 31 językach.

Jeśli nie określisz głosu, zostanie użyty domyślny głos Puck. Możesz też skonfigurować model tak, aby odpowiadał jednym z tych głosów:

Aoede (kobieta)
Charon (mężczyzna) Fenrir (mężczyzna)
Kore (kobieta) Puck (mężczyzna)

Demo tych głosów i pełną listę dostępnych języków znajdziesz w artykule Chirp 3: Głosy HD.

Aby określić głos, ustaw nazwę głosu w obiekcie speechConfig w ramach konfiguracji modelu:

Swift

Live API nie jest jeszcze obsługiwany w przypadku aplikacji na platformę Apple, ale wkrótce się to zmieni.

Kotlin

// ...

val model = Firebase.vertexAI.liveModel(
    modelName = "gemini-2.0-flash-live-preview-04-09",
    // Configure the model to use a specific voice for its audio response
    generationConfig = liveGenerationConfig {
        responseModality = ResponseModality.AUDIO
        speechConfig = SpeechConfig(voice = Voices.FENRIR)
    }
)

// ...

Java

// ...

LiveModel model = Firebase.getVertexAI().liveModel(
    "gemini-2.0-flash-live-preview-04-09",
    // Configure the model to use a specific voice for its audio response
    new LiveGenerationConfig.Builder()
        .setResponseModalities(ResponseModality.AUDIO)
        .setSpeechConfig(new SpeechConfig(Voices.FENRIR))
        .build()
);

// ...

Web

Live API nie jest jeszcze obsługiwany w przypadku aplikacji internetowych, ale wkrótce się to zmieni.

Dart

// ...

final model = FirebaseVertexAI.instance.liveModel(
  model: 'gemini-2.0-flash-live-preview-04-09',
  // Configure the model to use a specific voice for its audio response
  config: LiveGenerationConfig(
    responseModality: ResponseModality.audio,
    speechConfig: SpeechConfig(voice: Voice.fenrir),
  ),
);

// ...

Aby uzyskać najlepsze wyniki, gdy chcesz, aby model odpowiadał w języku innym niż angielski, w ramach instrukcji systemowych podaj te informacje:

RESPOND IN LANGUAGE. YOU MUST RESPOND UNMISTAKABLY IN LANGUAGE.

Zachowanie kontekstu w przypadku różnych sesji i żądań

Strukturę czatu możesz wykorzystać do zachowania kontekstu w różnych sesjach i żądaniach. Pamiętaj, że działa to tylko w przypadku danych wejściowych i wyjściowych tekstowych.

To podejście najlepiej sprawdza się w przypadku krótkich kontekstów. Możesz wysyłać interakcje krok po kroku, aby odzwierciedlić dokładną sekwencję zdarzeń. W przypadku dłuższych kontekstów zalecamy podsumowanie w jednym komunikacie, aby zwolnić miejsce w oknie kontekstu na kolejne interakcje.

Zarządzanie powiadomieniami

Vertex AI in Firebase nie obsługuje jeszcze obsługiwania przerw. Sprawdź jeszcze raz za jakiś czas.

Korzystanie z funkcji dzwonienia (narzędzia)

Podobnie jak w przypadku standardowych metod generowania treści, możesz definiować narzędzia, takie jak dostępne funkcje, do korzystania z interfejsu Live API. W tej sekcji opisano pewne niuanse korzystania z interfejsu Live API do wywoływania funkcji. Pełny opis i przykłady wywoływania funkcji znajdziesz w przewodniku po wywoływaniu funkcji.

Na podstawie jednego prompta model może wygenerować wiele wywołań funkcji i kodu niezbędnego do połączenia ich danych wyjściowych. Ten kod jest wykonywany w środowisku piaskownicy i generuje kolejne wiadomości BidiGenerateContentToolCall. Wykonanie zostaje wstrzymane do czasu, aż będą dostępne wyniki każdego wywołania funkcji, co zapewnia przetwarzanie sekwencyjne.

Korzystanie z interfejsu Live API z wywołaniem funkcji jest też szczególnie przydatne, ponieważ model może poprosić użytkownika o dodatkowe informacje lub o ich wyjaśnienie. Jeśli na przykład model nie ma wystarczającej ilości informacji, aby podać wartość parametru funkcji, którą chce wywołać, może poprosić użytkownika o dodatkowe informacje lub o ich wyjaśnienie.

Klient powinien odpowiedzieć: BidiGenerateContentToolResponse.

Ograniczenia i wymagania

Pamiętaj o tych ograniczeniach i wymaganiach dotyczących Live API.

Transkrypcja

Vertex AI in Firebase nie obsługuje jeszcze transkrypcji. Sprawdź jeszcze raz za jakiś czas.

Języki

Języki wprowadzania: zobacz pełną listę obsługiwanych języków wprowadzania w przypadku modeli Gemini.
Języki wyjściowe:pełną listę dostępnych języków wyjściowych znajdziesz w artykule Chirp 3: Głosy w jakości HD.

Formaty audio

Live API obsługuje te formaty audio:

Format audio wejściowego: surowy 16-bitowy PCM z częstotliwością 16 kHz w formacie little-endian.
Format wyjściowy dźwięku: surowy 16-bitowy dźwięk PCM z częstotliwością 24 kHz w formacie little-endian

Ograniczenia liczby żądań

Obowiązują te limity szybkości:

10 jednoczesnych sesji na projekt Firebase
4 mln tokenów na minutę

Długość sesji

Domyślny czas trwania sesji to 30 minut. Gdy czas trwania sesji przekroczy limit, połączenie zostanie zakończone.

Model jest też ograniczony rozmiarem kontekstu. Wysyłanie dużych fragmentów danych może spowodować wcześniejsze zakończenie sesji.

wykrywanie aktywności głosowej (VAD);

Model automatycznie wykrywa aktywność głosową (VAD) w ciągłym strumieniu danych wejściowych audio. Funkcja VAD jest domyślnie włączona.

Liczenie tokenów

Nie możesz używać interfejsu API CountTokens z interfejsem Live API.

Strumieniowanie dwukierunkowe za pomocą interfejsu Gemini Live API Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

Zanim zaczniesz

Modele, które obsługują tę funkcję

Korzystanie ze standardowych funkcji usługi Live API

Wysyłanie i odbieranie SMS-ów

Swift

Kotlin

Java

Web

Dart

Wysyłanie i odbieranie dźwięku

Swift

Kotlin

Java

Sieć

Dart

Wysyłanie dźwięku i odbieranie tekstu

Swift

Kotlin

Java

Web

Dart

Wysyłanie tekstu i odbieranie dźwięku

Swift

Kotlin

Java

Web

Dart

Twórz bardziej angażujące i interaktywne treści

Zmiana głosu w odpowiedzi

Swift

Kotlin

Java

Web

Dart

Zachowanie kontekstu w przypadku różnych sesji i żądań

Zarządzanie powiadomieniami

Korzystanie z funkcji dzwonienia (narzędzia)

Ograniczenia i wymagania

Transkrypcja

Języki

Formaty audio

Ograniczenia liczby żądań

Długość sesji

wykrywanie aktywności głosowej (VAD);

Liczenie tokenów

Strumieniowanie dwukierunkowe za pomocą interfejsu Gemini Live API
Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.