Skip to content

Input any character to Chrome using voice agent (ignore typing)

Notifications You must be signed in to change notification settings

lovesickness111/Smart_Voice_Input

Repository files navigation

Smart Voice Input

🎤 Chrome Extension nhập liệu thông minh bằng giọng nói cho Google Sheets và các trang web khác.

Smart Voice Input

✨ Tính năng

  • 🎙️ Nhận dạng giọng nói thời gian thực - Web Speech API
  • 🌍 Đa ngôn ngữ - Tiếng Việt, Anh, Nhật, Hàn, Trung
  • 💬 Voice Commands - "chấm", "phẩy", "xuống dòng"
  • 📊 Google Sheets & Docs - Chèn text trực tiếp
  • ⌨️ Phím tắt - Alt+V
  • 🎨 Dark theme - Giao diện hiện đại
  • 📌 Player tab ghim - Không chuyển focus khi ghi âm
  • 🔄 Dynamic targeting - Nhập liệu vào tab đang focus

🚀 Cài đặt

Developer Mode

  1. Mở Chrome → chrome://extensions/
  2. Bật Developer mode (góc trên phải)
  3. Click Load unpacked
  4. Chọn thư mục Smart_Voice_Input
  5. Làm theo Setup Wizard

📖 Sử dụng

Phím tắt (Khuyến nghị)

  1. Focus vào ô input bất kỳ
  2. Nhấn Alt+V → Player tab bật lên (ghim)
  3. Nói văn bản → Popup overlay hiển thị
  4. Nhấn Enter để chèn | Esc để hủy

Click Popup

  1. Click icon extension
  2. Chọn ngôn ngữ
  3. Nhấn Bắt đầu ghi âm

🗣️ Voice Commands

Tiếng Việt Tiếng Anh Kết quả
"chấm" "period" .
"phẩy" "comma" ,
"dấu chấm hỏi" "question mark" ?
"xuống dòng" "new line"
"tab" "tab"

📁 Cấu trúc

Smart_Voice_Input/
├── manifest.json          # Config extension
├── background/            # Service worker
├── content/               # Content script  
├── player/                # Player page (mic access)
├── popup/                 # Extension popup
├── setup/                 # Setup wizard
├── options/               # Settings page
├── lib/                   # Shared libraries
│   ├── voice-commands.js
│   ├── gemini-api.js      # Gemini integration (WIP)
│   └── session-manager.js
└── icons/

⚙️ Yêu cầu

  • Chrome 109+ (Manifest V3)
  • Microphone
  • Internet (Web Speech API)

🔧 Khắc phục sự cố

Vấn đề Giải pháp
Mic không hoạt động Click icon 🔒 trên address bar → Allow
Không nhận dạng được Kiểm tra ngôn ngữ, nói rõ ràng
Google Docs không nhận Copy đã vào clipboard → Nhấn Ctrl+V

🛣️ Roadmap

  • Web Speech API
  • Voice Commands
  • Dynamic tab targeting
  • Setup Wizard
  • Gemini 2.5 Flash integration
  • Context-aware transcription
  • Screenshot + OCR

📜 License

MIT License

👨‍💻 Tác giả

Nguyễn việt Cường. Phở bò: http://facebook.com/lovesickness111 Gờ mêu: vietcuong.uet@gmail.com

About

Input any character to Chrome using voice agent (ignore typing)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •