where Y is a generic random variable with PDF F We consider Markovian control policies a = {anln>1. which at each time n depend only on the current state, that is, an(X,) := b, for n > 0. Abusing the notation, we will identify functions a: X → B with stationary strategies, where B = [bmin. 1), the decision space. Consider an arbitrary initial state Xo =x 2 0 (note that the initial value is not stochastic) and control policy 1 = {an}n>1. Then, by iteration of (1), and assuming that (2) and (3) hold, it follows that, for n> 1, X, satisfies
 
Results (
Thai) 2:
[Copy]Copied!
โดยที่ Y คือตัวแปรสุ่มทั่วไปที่มีรูปแบบไฟล์ PDF F เราพิจารณานโยบายการควบคุม Markovian a = {anln > 1 ซึ่งในแต่ละครั้งจะขึ้นอยู่กับสถานะปัจจุบันนั่นคือ an (X,): = b สำหรับ n > 0 การเหยียดหยามเราจะระบุฟังก์ชัน: X → B ที่มีกลยุทธ์การนิ่งที่ B = [นาทีที่ 1) พื้นที่การตัดสินใจ พิจารณา Xo สถานะเริ่มต้นโดยพลการ = x 2 0 (โปรดทราบว่าค่าเริ่มต้นไม่ได้สุ่ม) และนโยบายการควบคุม 1 = {an} n > 1 จากนั้น, โดยการเกิดซ้ำของ (1), และสมมติว่า (2) และ (3) ถือ, ต่อไปนี้, สำหรับ n > 1, X, ตอบสนอง
Being translated, please wait..
