🤖 Gemini Realtime Multimodal Chat

A real-time multimodal chat application powered by Google's Gemini AI. This project enables real-time communication with Gemini's advanced AI capabilities through WebSocket connections, supporting both text and multimodal interactions.

View on GitHub

✨ Features

🎯 Real-time Gemini AI Integration
🖼️ Multimodal Support (Text + Images)
🔄 WebSocket-based Real-time Communication
🔐 Secure Environment Configuration
⚡ Async/Await Implementation
📱 Cross-platform Support

🛠️ Requirements

google-genai==0.2.2
websockets
python-dotenv

🚀 Getting Started

Clone the repository:

git clone https://github.com/jadouse5/gemini-realtime-multimodal.git
cd gemini-realtime-multimodal

Set up virtual environment:

python -m venv venv
source venv/bin/activate  # On Windows: venv\Scripts\activate

Install dependencies:
```
pip install -r requirements.txt
```
Configure environment: Create .env file:
```
GOOGLE_API_KEY=your_gemini_api_key_here
```

💻 Usage

Start the server:
```
python main.py
```
Connect to WebSocket:

python -m http.server 8000

Connect using your preferred WebSocket client

🔧 Configuration Options

GOOGLE_API_KEY: Your Gemini API key
PORT: WebSocket server port (default: 8765)
HOST: WebSocket server host (default: localhost)

🤝 Contributing

Contributions are welcome! To contribute:

Fork the repository
Create your feature branch (git checkout -b feature/AmazingFeature)
Commit changes (git commit -m 'Add AmazingFeature')
Push to branch (git push origin feature/AmazingFeature)
Open a Pull Request

📝 License

This project is licensed under the MIT License - see the LICENSE file for details.

👤 Author

Jad Tounsi

GitHub: @jadouse5

🙏 Acknowledgments

Google Gemini AI team
WebSocket protocol contributors
Python async/await community

📚 Documentation

For detailed documentation on the Gemini API, visit:

Google Gemini API Documentation

Made with ❤️ and Python

This README has been updated to specifically match your repository at jadouse5/gemini-realtime-multimodal and includes relevant sections for a multimodal AI chat application using Gemini.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.env.example		.env.example
.gitignore		.gitignore
README.md		README.md
index.html		index.html
main.py		main.py
pcm-processor.js		pcm-processor.js
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🤖 Gemini Realtime Multimodal Chat

✨ Features

🛠️ Requirements

🚀 Getting Started

💻 Usage

Connect using your preferred WebSocket client

🔧 Configuration Options

🤝 Contributing

📝 License

👤 Author

🙏 Acknowledgments

📚 Documentation

About

Releases

Packages

Languages

jadouse5/gemini-realtime-multimodal

Folders and files

Latest commit

History

Repository files navigation

🤖 Gemini Realtime Multimodal Chat

✨ Features

🛠️ Requirements

🚀 Getting Started

💻 Usage

Connect using your preferred WebSocket client

🔧 Configuration Options

🤝 Contributing

📝 License

👤 Author

🙏 Acknowledgments

📚 Documentation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages