프로젝트/라즈베리파이를 이용한 AI 스피커

구글 클라우드 플랫폼(GCP)를 통해 음성, 언어, 텍스트 API 이용해보기 - (1)

eunjuu 2023. 10. 4. 15:39
728x90

📌 할 일

  • STT → TTS 샘플로 확인하는 것 GCP API
  • GCP TTS 사용해서 다양한 음성 합성하는 방법 확인하기 (Custom data로 학습시켜서 음성 출력)

Google Cloud Platform (GCP)을 사용하여 음성 인식 (STT - Speech-to-Text) 및 음성 합성 (TTS - Text-to-Speech)을 수행하려면 다음과 같은 단계를 따른다.

 

  1. GCP 프로젝트 생성:
  2. API 활성화:
    • GCP Console에서 프로젝트를 선택한 후 "API 및 서비스", "라이브러리"로 이동하여 "Cloud Text-to-Speech API" 및 "Cloud Speech-to-Text API"를 활성화
  3. 인증 정보 생성:
    • "API 및 서비스" 섹션에서 "사용자 인증 정보"로 이동하여 서비스 계정을 만들고 JSON 형식의 키 파일을 다운로드 (이 키 파일을 활용하여 GCP API를 사용할 수 있음)
  4. STT (Speech-to-Text) API 사용:
    • Python과 같은 언어를 사용하여 Cloud STT API를 호출하여 오디오 파일을 텍스트로 변환할 수 있습니다. 이를 위해서는 API 클라이언트 라이브러리를 설치하고 키 파일을 사용하여 인증해야 합니다.
  5. TTS (Text-to-Speech) API 사용:
    • Cloud TTS API를 사용하여 텍스트를 음성으로 합성할 수 있습니다. API 클라이언트 라이브러리를 설치하고 키 파일을 사용하여 인증합니다.

 

☁️ 하나씩 해보자!

 

 

1. GCP 프로젝트 생성: GCP Console (https://console.cloud.google.com/) 에서 GCP 프로젝트를 생성

My First Project

참고 링크 : https://jybaek.tistory.com/606

 

GCP(Google Cloud Platform) 시작하기

GCP(Google Cloud Platform) 를 사용하는 과정을 기록하도록 한다. 본편에서는 가입하는 과정에 대해 기술하고, 이후부터 API 사용법 등에 대해 다뤄보도록 하겠다.우선 사용을 위해 cloud.google.com 으로 접

jybaek.tistory.com

 

2. API 활성화: GCP Console에서 프로젝트를 선택한 후 "API 및 서비스", "라이브러리"로 이동하여 "Cloud Text-to-Speech API" 및 "Cloud Speech-to-Text API"를 활성화

 

API 및 서비스 → 라이브러리
Cloud Speech-to-Text API, Cloud Text-to-Speech API
API 사용 설정됨

 

3. 인증 정보 생성: "API 및 서비스" 섹션에서 "사용자 인증 정보"로 이동하여 서비스 계정을 만들고 JSON 형식의 키 파일을 다운로드 (이 키 파일을 활용하여 GCP API를 사용할 수 있음)

**이건 블로그 열심히 서치하면서 대충 하라는 대로 해본건데.... 맞는지는 잘 모르겠음... 😅

참고 링크 : https://keepgoin9.tistory.com/9?category=1126827

 

[Spring] Google Speech-to-Text로 오디오 파일을 스크립트로 변환하기

Google Cloud Platform에서 제공하는 Speech-to-Text API를 활용하여 10초 이내의 오디오 파일을 스크립트로 변환합니다 목차 내 프로젝트 환경 JVM 17.0.6 Gradle 7.6 Springboot 3.0.2 시작하기 전에 프로젝트에서 Spe

keepgoin9.tistory.com

 

API 및 서비스 → 사용자 인증 정보

 

 

+ 사용자 인증 정보 만들기 → 서비스 계정

 

서비스 계정 이름 입력
키 추가 → 새 키 만들기

 

JSON

 

 

키 파일이 다운로드 되었다.

 

export GOOGLE_APPLICATION_CREDENTIALS="/경로/서비스-키.json"

 

📟 STT (Speech-to-Text) API 사용

STT란 Speech-to-text의 약자로 말 그대로 말하는 것(음성)을 문자(텍스트)로 바꿔주는 AI기술

 

관리 클릭

📟 TTS (Text-to-Speech) API 사용

TTS란 Text-to-speech의 약자로 말 그대로 문자(텍스트)를 말하는 것(음성)으로 바꿔주는 AI기술

 

일단 여기까지. . . .

 

 

728x90