본문 바로가기

카테고리 없음

[인공지능] Decision Networks and Value of Information - 1

Outline

  • 의사 결정 네트워크
    • 기대 효용
    • 최대 기대 효용
  • 정보 가치

제목: 의사 결정 네트워크와 정보 가치

I. 의사 결정 네트워크
   A. 기대 효용
      - 기대 효용은 어떤 선택 또는 행동의 결과를 고려하여 예상되는 효용을 평가하는 과정입니다. 이것은 의사 결정을 내리는 데 중요한 개념 중 하나입니다.

   B. 최대 기대 효용
      - 최대 기대 효용은 가능한 여러 선택 중에서 기대 효용이 최대인 선택을 찾는 것을 의미합니다. 이것은 최적의 결정을 내릴 때 사용되는 중요한 개념입니다.

II. 정보 가치
   - 정보 가치는 어떤 정보를 얻는 것이 의사 결정에 어떤 영향을 미칠 수 있는지를 나타내는 개념입니다. 정보를 효과적으로 활용하여 최상의 의사 결정을 내리는 데 도움이 됩니다.


Decision Networks

  • MEU: 증거가 주어졌을 때 기대 효용을 최대화하는 조치를 선택합니다.
  • 의사 결정 네트워크를 사용하여 이를 직접 운용화할 수 있습니다.
    • 유틸리티와 조치에 대한 노드가 있는 베이즈 네트워크
    • 각 조치에 대한 기대 효용을 계산할 수 있게 해줍니다.
  • 새로운 노드 유형:
    • 확률 노드 (베이지안 네트워크와 동일)
    • 조치 (직사각형, 부모가 될 수 없으며 관찰된 증거 역할)
    • 유틸리티 노드 (다이아몬드, 조치 및 확률 노드에 의존)

결정 네트워크는 의사 결정을 지원하는 데 사용되는 그래프 형식의 모델입니다. 여기에 나열된 주요 개념들을 설명하겠습니다.

  1. MEU (Maximum Expected Utility): MEU는 주어진 정보나 증거를 기반으로 최적의 의사 결정을 내리기 위해 사용되는 개념입니다. MEU를 계산하면 기대 효용을 최대화하는 행동을 선택할 수 있습니다.
  2. Decision Networks (의사 결정 네트워크): 의사 결정 네트워크는 베이지안 네트워크와 유사한 구조를 가지며, 유틸리티와 행동에 대한 노드가 포함됩니다. 이러한 네트워크를 사용하면 각 행동에 대한 예상 효용을 계산할 수 있어 의사 결정을 지원합니다.
  3. New Node Types (새로운 노드 유형):
    • Chance Nodes (확률 노드): 확률 노드는 베이지안 네트워크의 확률 노드와 유사하게 확률 변수를 나타내는 데 사용됩니다.
    • Actions (조치): 조치는 직사각형으로 나타내며 부모 노드를 가질 수 없습니다. 이는 관찰된 증거로 작용합니다.
    • Utility Node (유틸리티 노드): 유틸리티 노드는 다이아몬드 모양으로 표현되며 조치와 확률 노드에 의존합니다. 유틸리티 노드는 기대 효용을 나타냅니다.

의사 결정 네트워크를 사용하면 주어진 정보와 환경에서 최상의 의사 결정을 내리는 데 도움이 되는 모델을 만들 수 있습니다. MEU를 계산하여 기대 효용을 최대화하는 조치를 선택함으로써 최적의 의사 결정을 도출할 수 있습니다.


  • 행동 선택
    • 모든 증거를 구체화합니다.
    • 가능한 모든 방법으로 조치 노드를 설정합니다.
    • 유틸리티 노드의 모든 부모에 대한 사후 확률을 계산합니다.
    • 각 조치에 대한 기대 효용을 계산합니다.
    • 최대 기대 효용을 선택합니다.

결정 네트워크에서의 행동 선택 과정은 다음과 같이 설명할 수 있습니다:

1. **모든 증거를 구체화합니다.**
   - 먼저, 주어진 의사 결정 상황에서의 모든 증거를 고려합니다. 이 증거는 주어진 정보나 조건에 대한 정보입니다.

2. **가능한 모든 방법으로 조치 노드를 설정합니다.**
   - 다음으로, 각각의 가능한 조치 노드를 설정합니다. 즉, 모든 가능한 행동을 고려합니다.

3. **유틸리티 노드의 모든 부모에 대한 사후 확률을 계산합니다.**
   - 사후 확률은 주어진 증거에 대한 조건부 확률입니다. 유틸리티 노드의 모든 부모 노드에 대해 주어진 증거에 따른 조건부 확률을 계산합니다.

4. **각 조치에 대한 기대 효용을 계산합니다.**
   - 이제 각 조치에 대한 기대 효용을 계산합니다. 기대 효용은 해당 조치를 선택할 때 예상되는 효용의 평균입니다. 이를 계산하기 위해 조치 노드를 설정하고, 부모 노드의 사후 확률을 사용하여 기대 효용을 계산합니다.

5. **최대 기대 효용을 선택합니다.**
   - 최종적으로, 각 조치에 대한 기대 효용을 비교하고, 가장 높은 기대 효용을 가지는 조치를 선택합니다. 이것이 최적의 의사 결정입니다.

이러한 절차를 통해 결정 네트워크를 사용하여 주어진 상황에서 최상의 의사 결정을 내릴 수 있습니다.


Decision Networks: Example

 

A W U(A,W)
leave sun 100
leave rain 0
take sun 20
take rain 70
  • 우산 = 나가기
    • EU(나가기) = ∑(모든 날씨) [P(날씨) * U(나가기, 날씨)] = 0.7 × 100 + 0.3 × 0 = 70
  • 우산 = 가져가기
    • EU(가져가기) = ∑(모든 날씨) [P(날씨) * U(가져가기, 날씨)] = 0.7 × 20 + 0.3 × 70 = 35
  • 최적의 결정 = 나가기
    • MEU(𝜙) = max(모든 행동) [EU(행동)] = 70

결정 네트워크 예시:

1. "우산 = 나가기" 경우:
   - "나가기"라는 행동을 선택했을 때의 기대 효용(EU)을 계산합니다.
   - 모든 가능한 날씨 조건에 대해 기대 효용을 합산합니다.
   - 확률로 나타낸 날씨 조건에 따라 효용이 다르게 계산되며, 그 결과 "나가기"의 EU는 70이 됩니다.

2. "우산 = 가져가기" 경우:
   - "가져가기"라는 행동을 선택했을 때의 기대 효용(EU)을 계산합니다.
   - 모든 가능한 날씨 조건에 대해 기대 효용을 합산합니다.
   - 확률로 나타낸 날씨 조건에 따라 효용이 다르게 계산되며, 그 결과 "가져가기"의 EU는 35가 됩니다.

3. 최적의 결정:
   - "나가기"의 EU가 70으로 "가져가기"의 EU보다 높습니다.
   - 그래서 최대 기대 효용(MEU)을 찾기 위해 "나가기"를 선택합니다.

이러한 예시에서는 날씨 조건에 따라 행동의 예상 효용을 계산하고, 기대 효용이 가장 높은 "나가기"를 선택하는 최적의 결정을 내린 것을 보여줍니다.


Decision Networks: Notation(표기법)

  • EU(나가기): 나가기 행동의 기대 효용
    • 괄호 안에 행동을 작성합니다.
    • EU 계산에는 확률 노드 결과에 대한 기대값을 계산해야 합니다.
  • MEU(𝜙): 정보가 없는 경우의 최대 기대 효용
    • 괄호 안에 증거를 작성합니다 (어떤 노드들을 알고 있는지).
    • MEU 계산에는 여러 기대값을 최댓값으로 취하는 과정이 필요합니다 (각 행동당 하나의 EU).

  1. EU(나가기): 나가기 행동을 선택했을 때의 기대 효용을 나타냅니다.
    • 괄호 안에는 특정 행동을 기술합니다.
    • EU를 계산하기 위해서는 확률 노드 결과에 대한 기대값을 계산해야 합니다. 이것은 주어진 행동에 대한 예상 효용을 의미합니다.
  2. MEU(𝜙): 어떠한 정보도 없는 상태에서의 최대 기대 효용을 나타냅니다.
    • 괄호 안에는 증거를 표시합니다 (어떤 노드들이 알려져 있는지).
    • MEU를 계산하려면 여러 기대값 중에서 최댓값을 찾는 과정이 필요합니다. 각 행동에 대한 EU를 계산하고, 그 중에서 가장 큰 값을 찾아 최적의 결정을 내립니다. 이것은 아무런 정보 없이 최선의 행동을 선택하는 경우에 해당합니다.