본문으로 건너뛰기
S
중급12분 소요

PROMPT 점수 프레임워크 완벽 해설

ScoreMyPrompt를 구동하는 PROMPT 점수 프레임워크를 깊이 파헤칩니다. 각 차원이 어떻게 채점되는지, 어떻게 개선하는지 정확히 배우세요.

PROMPT 점수란?

PROMPT 점수는 AI 프롬프트의 품질을 6가지 핵심 차원에서 평가하는 체계적 프레임워크입니다. 0-100점 채점 시스템으로, 높은 점수가 더 효과적이고 잘 구조화된 프롬프트를 나타내며 더 나은 AI 출력을 생성합니다.

6가지 차원 각각 — 정확성(Precision), 역할(Role), 출력 형식(Output Format), 미션 컨텍스트(Mission Context), 구조(Structure), 맞춤화(Tailoring) — 은 프롬프트 품질의 특정 측면을 다룹니다. 어느 하나의 차원이 다른 것보다 중요한 것은 아닙니다; 함께 작동합니다. 한 차원이 약한 프롬프트는 전체적으로 약한 출력을 만듭니다.

이 프레임워크는 수천 건의 성공적인 AI 상호작용을 연구하고 고성과 프롬프트의 공통 패턴을 파악하여 개발되었습니다. 자의적이거나 이론적인 것이 아닙니다. 사람들이 AI 모델과 상호작용할 때 실제로 효과가 있는 것에 기반합니다.

PROMPT 점수는 정확히 어디를 개선해야 하는지 알려줍니다. 75점은 역할과 출력 형식에는 강하지만 정확성과 미션 컨텍스트가 약하다는 의미일 수 있습니다. 이런 구체적인 피드백으로 반복적으로 개선할 수 있습니다.

정확성 (P): 구체적이고 상세하게

정확성은 프롬프트가 얼마나 구체적이고 상세한지를 측정합니다. 모호한 프롬프트가 출력 품질의 1위 킬러입니다.

정확성 채점 기준:

0-25점: 매우 모호. "글 써줘", "아이디어 줘", "이것 분석해줘." 원하는 것에 대한 구체성 없음.

26-50점: 어느 정도의 구체성. "마케팅에 대한 블로그 포스트 써줘" 또는 "세일즈 이메일 만들어줘." 구체적 세부 사항이나 제약 부족.

51-75점: 적절한 구체성. 주제가 명확하고, 길이가 지정되고, 대상이 언급됨. 특정 데이터 포인트, 정확한 제약, 구체적 예시 등이 부족.

76-100점: 매우 정확. 구체적 숫자, 실제 예시, 정확한 제약, 관련 세부 사항 명시, 범위 경계가 명확함.

정확성 개선 방법:

모호한 단어를 구체적으로 바꾸기: "곧" → "90일 이내" | "좋은" → "클릭률 15% 증가"

숫자 추가: 글자 수, 기간, 수량, 퍼센트, 목표 지표.

구체적 예시 제공: "[특정 예시]와 비슷하게" 또는 "[레퍼런스] 스타일로."

제약 정의: 최대 길이, 특정 형식, 포함하지 않을 것, 기술적 요구사항.

이해관계자 명시: "대상을 위해"가 아닌 "시리즈 B SaaS 기업의 CFO를 위해."

예시: 수정 전 (정확성: 35/100) "마케팅 이메일 써줘." 수정 후 (정확성: 88/100) "중견 금융 서비스 기업(직원 500-2,000명) IT 매니저를 타겟으로 한 75자 콜드 아웃리치 이메일을 써줘. 목표: 20분 디스커버리 콜 답장 유도. 우리의 가장 큰 차별점 강조: 월 40시간 이상 절약하는 컴플라이언스 자동화. 톤: 전문적이지만 인간적. 업계 페인 포인트(규제 컴플라이언스 복잡성)를 훅으로 사용. 구체적 소셜 프루프 지표 하나 포함."

역할 (R): 관점과 전문성 정의

역할 채점은 AI가 채택할 관점이나 전문성 렌즈를 명확히 부여했는지 측정합니다. 이것이 AI가 요청에 접근하는 방식을 형성합니다.

역할 채점 기준:

0-25점: 역할 미지정. AI가 일반적인 "친절한 도우미" 모드로 기본 설정.

26-50점: 약하거나 일반적인 역할. 구체성 없이 "전문가", "프로", "경험 있는 사람."

51-75점: 명확한 역할이지만 더 구체적일 수 있음. 업계나 맥락 전문화 없이 "마케팅 전문가", "프로덕트 매니저", "컨설턴트."

76-100점: 관련 자격이나 맥락이 있는 매우 구체적인 역할. "시리즈 B SaaS 스타트업의 시니어 그로스 마케팅 디렉터" 또는 "B2B SaaS 온보딩 전문 UX 리서처."

역할 개선 방법:

항상 "~로 행동해줘", "당신은 ~입니다", "~라고 가정해줘"로 시작

직함을 넘어서: 경력 수준 추가: "주니어" vs "시니어" vs "디렉터급"

전문화나 맥락 추가: "B2B 전문 그로스 마케터", "접근성 전문 프로덕트 디자이너", "벤처 투자 핀테크의 CFO"

창의적 작업에는 스타일 아이콘 참조: "David Ogilvy처럼 쓰는 카피라이터 스타일로" 또는 "수상 경력의 크리에이티브 디렉터의 창의적 감각으로."

관점 변형 고려: "회의적인 투자자", "고객 옹호자", "프로덕트 매니저"는 모두 같은 요청을 다르게 접근합니다.

예시: 수정 전 (역할: 40/100) "카피 좀 써줘." 수정 후 (역할: 92/100) "당신은 기술 제품 고전환 랜딩 페이지 전문 B2B SaaS 카피라이터로 수상 경력이 있습니다. 50개 이상의 스타트업 자금 유치를 도왔습니다. 기술 창업자와 CTO에게 어필하는 간결하고 직접적인 스타일로 씁니다. 기술적 정확성과 마케팅 매력 사이의 긴장을 이해합니다. 이제 써주세요…"

출력 형식 (O): 구조와 전달 방식 지정

출력 형식은 정보를 어떻게 전달받고 싶은지 얼마나 명시적으로 지정했는지 측정합니다. 응답의 사용성에 영향을 미칩니다.

출력 형식 채점 기준:

0-25점: 형식 미지정. "정보 줘" 또는 "뭔가 써줘." AI가 형식을 추측.

26-50점: 일반적 형식. 구조에 대한 구체성 없이 "글머리 기호", "짧게", "자세하게."

51-75점: 어느 정도 구조가 있는 명확한 형식. "글머리 기호 목록", "세 개 섹션", "JSON 객체"를 지정. 세부 사항 부족.

76-100점: 상세한 구조가 있는 매우 구체적인 형식. 정확한 템플릿, 필드명, 하위 섹션 요구사항, 정확한 구분자, 샘플 출력 포함.

출력 형식 개선 방법:

컨테이너 지정: 글머리 기호, 번호 목록, 단락, 표, 코드, JSON, 마크다운, 개요 등.

하위 섹션 정의: "세 개의 메인 섹션 포함: 개요, 혜택, 구현."

세분화 수준 기대치 설정: "각 항목은 2-3문장" 또는 "각 글머리 기호 최대 15단어."

템플릿 제공: "이 형식을 사용해줘: [라벨]: [값] (단위)"

정확한 구조 지정: "먼저 경영진 요약(2단락), 소제목이 있는 5개 메인 섹션, 그리고 결론."

기술적 출력: "이 필드가 있는 유효한 JSON으로 반환: title, description, difficulty, prerequisites."

예시: 수정 전 (형식: 35/100) "아이디어 좀 나열해줘." 수정 후 (형식: 91/100) "정확히 5개 콘텐츠 아이디어를 번호 목록으로 제공해줘. 각 아이디어에 포함: (1) 헤드라인(최대 12단어), (2) 콘텐츠 유형(블로그 포스트/영상/인포그래픽/트윗), (3) 왜 효과적인지(1문장), (4) 참여 훅(공유하고 싶게 만드는 이유 2개), (5) 예상 도달 효과(높음/중간/낮음). 일관성을 위해 이 정확한 형식을 사용해줘."

미션 컨텍스트 (M): 왜 필요한지, 어떻게 사용할지 설명

미션 컨텍스트는 요청의 "왜"와 출력을 어떻게 사용할지를 설명했는지 측정합니다. AI가 톤, 깊이, 관련성을 조정하는 데 도움을 줍니다.

미션 컨텍스트 채점 기준:

0-25점: 맥락 미제공. AI가 왜 필요한지, 무엇에 사용할지 모름.

26-50점: 모호한 맥락. "비즈니스용" 또는 "마케팅 개선을 위해." 사용 사례 구체성 부족.

51-75점: 명확하지만 불완전한 맥락. "SMB 타겟 랜딩 페이지용" 또는 "투자자 피칭용." 제약이나 우선순위 부족.

76-100점: 풍부하고 구체적인 맥락. 오디언스, 의사결정자, 타임라인, 성공 지표, 출력 활용법, 경쟁 맥락 설명.

미션 컨텍스트 개선 방법:

항상 "저는~" 또는 "이것이 필요한 이유는~" 문장 포함

결정이나 행동에 대해 구체적으로: "시리즈 A 투자자에게 피칭하기 위한 것"이지 "회사를 위해"가 아님.

이것을 보거나 사용할 대상 설명: "내부 팀", "외부 클라이언트", "일반 대중."

타임라인 포함: "30일 내 출시용", "이번 주 이사회 미팅용."

성공 지표 언급: "목표는 5% 전환율", "20% 참여율 달성."

경쟁 맥락 참조: "[경쟁사]와 비교하여" 또는 "이전 [지표]보다 나은."

제약 설명: "법무팀 승인 필요", "30초 영상에 맞아야 함", "예산 제한."

예시: 수정 전 (맥락: 30/100) "마케팅 전략이 필요해." 수정 후 (맥락: 87/100) "90일 후 새 B2B SaaS 제품을 출시합니다. 타겟 고객: 직원 10-50명, 연매출 5억-20억원 마케팅 에이전시. 이 전략은 CEO의 투자자 피칭에 활용되고, 첫 90일 실행을 안내하며, 마케팅 예산 우선순위를 설정합니다. 성공 지표: 첫 분기 50건 자격 데모 예약. 투자자가 명확한 GTM 전략을 보고 싶어하기 때문에 필요합니다. 경쟁 맥락: [저가 도구]와 [엔터프라이즈 플랫폼] 사이에 포지셔닝."

구조 (S): 요청을 논리적으로 조직

구조는 요청을 논리적이고 순차적인 단계로 얼마나 잘 조직했는지 측정합니다. AI가 체계적으로 사고하는 데 도움을 줍니다.

구조 채점 기준:

0-25점: 비조직적. 여러 관련 없는 요청이 뒤섞임. 논리를 따라가기 어려움.

26-50점: 어느 정도 조직적. 요청에 여러 부분이 있지만 전환이 불명확. 일부 중복.

51-75점: 잘 조직됨. 아이디어의 명확한 진행. 논리적으로 그룹화된 다수의 관련 요청. 사소한 중복.

76-100점: 우수한 구조. 명확한 논리의 요청. 각 단계가 이전 위에 쌓임. 중복 없음. 따라가기 쉬움.

구조 개선 방법:

중요한 것 먼저: 맥락과 역할을 처음에, 구체적 요청은 그 후에.

다단계 요청에 번호 사용: "먼저 분석하고… 그 다음 추천하고… 마지막으로 만들어줘…"

관련 항목 그룹화: 10개 요청이 있으면 3개 논리적 버킷으로 조직.

명확한 전환 사용: "맥락을 이해했으니, 이제…"

제약은 마지막에: 역할과 맥락 먼저, 메인 요청, 그 다음 상세 제약.

반복 피하기: 같은 지시를 다른 표현으로 반복하지 않기.

포맷 활용: 줄바꿈, 번호, 글머리 기호로 구조를 시각적으로 보여주기.

예시: 수정 전 (구조: 45/100) "이메일 써줘. 친근하게. 혜택 포함. 짧게. 전문적으로. 너무 길지 않게. CTA도 넣고. 톤은 따뜻하게." 수정 후 (구조: 89/100) "이 구조로 콜드 아웃리치 이메일을 써줘: (1) 리서치를 보여주는 개인화된 오프닝, (2) 업종에 관련된 구체적 혜택 하나, (3) 신뢰성 문장(소셜 프루프 또는 관련 사례), (4) 명확한 요청(단일 CTA), (5) 전문적 마무리. 요구사항: 총 75-100자, 따뜻하지만 전문적 톤, 기업적 표현 금지."

맞춤화 (T): 특정 니즈에 맞게 커스터마이즈

맞춤화는 특정 상황, 대상, 제약에 맞게 요청을 얼마나 커스터마이즈했는지 측정합니다. 일반적 프롬프트와 정확하게 맞춤화된 프롬프트의 차이입니다.

맞춤화 채점 기준:

0-25점: 일반적. 거의 누구에게나 적용 가능. 특정 상황에 대한 커스터마이즈 없음.

26-50점: 약간의 커스터마이즈. 업종이나 대상을 참조하지만 깊이 부족.

51-75점: 잘 맞춤화됨. 업종, 회사 단계, 고객 유형, 대상에 구체적. 일부 세부 사항 부족.

76-100점: 고도로 맞춤화됨. 정확한 상황, 제약, 브랜드 보이스, 대상 정교함 수준, 기술 요구사항, 성공 정의에 구체적.

맞춤화 개선 방법:

업종 명시: "비즈니스를 위해"가 아닌 "벤처 투자를 받은 B2B SaaS 스타트업을 위해."

고객 지정: "고객을 위해"가 아닌 "중견 제조 기업의 CTO를 위해."

브랜드 보이스 포함: "우리 브랜드 보이스로, 대화체이고 데이터 중심이며 기업적이지 않은."

제약 참조: 예산, 기술적 한계, 법적 요구사항, 브랜드 가이드라인.

전문성 수준 지정: "비기술 창업자를 위해", "숙련된 엔지니어를 위해", "일반 대중을 위해."

경쟁 포지션 정의: "우리가 프리미엄 옵션이므로 톤은 프리미엄 포지셔닝을 반영해야 합니다."

구체적 지표나 정의 포함: "'성공'은 우리에게 ~를 의미합니다" 또는 "'높은 참여'를 ~로 정의합니다"

예시: 수정 전 (맞춤화: 35/100) "우리 제품에 대해 써줘." 수정 후 (맞춤화: 90/100) "AI 기반 경비 관리 플랫폼에 대한 500자 블로그 포스트를 써줘. 대상: SaaS 기업(직원 50-500명) 재무 전문가 (엔터프라이즈 아님, 솔로프리너 아님). 이미 경비 자동화가 필요하다고 확신함; 옵션 간 결정 중. 우리 독특한 각도: 150개 이상 회계 시스템과 통합, 영수증 분류 94% 정확도(업계 평균 87%). 브랜드 보이스: 전문적, 정확, 과대광고 없음, 가끔 약간 드라이. 목표: 데모 예약 15% 이상 전환. 톤: 수동 작업 줄이고자 하는 열망에 호소하면서 정확성과 통합에 대한 안심감. 피해야 할 것: 기술 용어, 과대 약속, 고객 후기."

채점 방식: 각 차원 점수 매기기

PROMPT 점수는 6가지 차원 각각을 평가하고 0-100점을 부여하여 계산됩니다. 전체 점수는 가중 평균입니다:

정확성 (20% 가중치): 구체성, 세부 사항, 제약, 구체성

역할 (15% 가중치): 관점과 전문성을 얼마나 잘 부여했는지

출력 형식 (20% 가중치): 정보 전달 방식의 명확성

미션 컨텍스트 (15% 가중치): 왜 필요한지, 어떻게 사용할지

구조 (15% 가중치): 논리적 조직과 흐름

맞춤화 (15% 가중치): 특정 상황에 대한 커스터마이즈

각 차원은 독립적으로 채점됩니다. 프롬프트가 출력 형식에서 90점(원하는 형식이 매우 명확)이지만 미션 컨텍스트에서 45점(왜 필요한지 설명 안 함)일 수 있습니다. 전체 PROMPT 점수는 6가지 차원 모두의 건강 상태를 반영합니다.

채점 기준:

0-30: 약함. 여러 차원에서 명확성 부족. 예상 출력 품질: 낮음.

31-50: 평균 이하. 일부 차원은 견고하지만 다른 차원에 작업 필요. 예상 출력 품질: 평균 이하.

51-70: 평균. 대부분의 차원이 적절하지만 개선 여지. 예상 출력 품질: 수용 가능하지만 개선 가능.

71-85: 양호. 대부분의 차원에서 높은 점수. 견고한 결과를 만들어야 함. 예상 출력 품질: 양호.

86-100: 우수. 모든 차원에서 잘 만들어진 프롬프트. 예상 출력 품질: 우수.

점수 올리기: 차원별 개선

전체 점수가 75 미만이라면, 개선을 위한 전략적 접근법입니다:

단계 1 - 가장 약한 차원 파악: 어떤 차원이 가장 낮은 점수인가요? 거기서 시작하세요. 한 차원이 약하면 전체 점수를 끌어내릴 수 있습니다.

단계 2 - 타겟 개선 적용: 가장 약한 차원에 대해 위의 "개선 방법" 섹션을 사용하세요. 한 번에 하나의 개선을 하고 다시 채점하세요.

단계 3 - 체계적으로 작업: 모든 것을 한꺼번에 개선하려 하지 마세요. 가장 낮은 점수의 차원을 고치고, 다시 채점하고, 다음 약점으로 이동하세요.

단계 4 - 트레이드오프 인식: 때로는 더 구체적(정확성)이 되면 길이가 늘어납니다. 괜찮습니다. 목표는 모든 차원 70 이상이지 모두 100이 아닙니다.

단계 5 - 템플릿 만들기: 프롬프트 구조를 완성하면 템플릿으로 저장하세요. 약간의 수정으로 비슷한 요청에 재사용하세요.

단계 6 - 진행 추적: 정기적으로 프롬프트를 채점하세요. 시간이 지나면서 기술이 발전함에 따라 전체 점수가 상승하는 트렌드를 볼 수 있습니다.

실제 결과: 연구에 따르면 75점 이상 프롬프트가 50점 미만 프롬프트보다 눈에 띄게 더 나은 출력을 지속적으로 만듭니다. 차이는 실질적이고 측정 가능합니다. 점수 개선에 투자하세요.

배운 내용을 테스트해 보세요

무료 PROMPT 점수 분석기로 배운 내용을 적용해 보세요.

이 가이드는 precision, role, outputFormat, missionContext, promptStructure, tailoring 에 초점을 맞추고 있습니다 — 프롬프트를 채점하고 이 차원에서 어떤 점수를 받는지 확인하세요.

지금 프롬프트 채점하기 →

매주 프롬프트 팁 받기

5,000명 이상의 전문가와 함께 AI 활용 능력을 높이세요.

무료 구독하기 →