본문 바로가기

전체 글82

강화학습_3_0802 스스로 돈을 벌때 까지 강화학습 할 예정! 이제는 관망하지 말고 행동할때! 복습도 할겸 누적식으로 글을 작성한다. 당구 큐대를 손바닥위에 세우고 안 넘어뜨리는 것을 강화학습 할때! 1. 그 행위를 하는 나 --> 에이전트(agent) 2. 큐대, 주위 당구대 위치, 친구의 목소리, 바닥의 재질, 그날의 나의 컨디션, 조명 --> 환경(environment) 목적(objective)는 에이전트가 받는 보상의 총합이다. 2.1 목적 : 1분 동안 큐대 안넘어뜨리기 상태 : [손바닥 위치, 손바닥 속도, 큐대 각도, 큐대 각속도]의 배열 행동 : (x,y,z) 손바닥 중심을 기준으로 벡터값 보상 : 큐대가 안 넘어지는 시간동안 +1 종료 : 큐대가 넘어지거나, 손바닥이 당구장 벽에 부딫이거나 최대 시간 1분에.. 2023. 8. 2.
백준_2559_수열_파이썬 문제 링크 2559번: 수열 첫째 줄에는 두 개의 정수 N과 K가 한 개의 공백을 사이에 두고 순서대로 주어진다. 첫 번째 정수 N은 온도를 측정한 전체 날짜의 수이다. N은 2 이상 100,000 이하이다. 두 번째 정수 K는 합을 구하기 www.acmicpc.net 부분합을 구할때 sum으로 처음에 했는데 연산량이 크더라.... 생각보다 차이가 크다 첫번째 빼고 마지막 추가하는게 훨씬 빠른걸 볼 수 있다. 두개의 포문 돌리기나 sum이나 비슷하다 1 2 3 4 5 6 7 8 9 one, two = map(int,input().split()) now_list = list(map(int,input().split())) first = sum(now_list[:two]) most_big = first for.. 2023. 8. 1.
현대_Softeer_level2_전광판_파이썬 하!!!!!!!!!! 인생 떡상 가즈아!!!!!!!! 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 def check_2(a,b): #2개의 숫자를 뒤에서부터 비교하고 차이나는 만큼 비교한다 score = 0 now = len(a)-len(b) if now >0: for i in range(-1,-len(b)-1,-1): score += how_many_lights(num_dict[a[i]], num_dict[b[i]]) for i in range(now): score += len(num_dict[a[i]]) e.. 2023. 8. 1.
강화학습_2_0731 스스로 돈을 벌때 까지 강화학습 할 예정! 이제는 관망하지 말고 행동할때! 복습도 할겸 누적식으로 글을 작성한다. 당구 큐대를 손바닥위에 세우고 안 넘어뜨리는 것을 강화학습 할때! 1. 그 행위를 하는 나 --> 에이전트(agent) 2. 큐대, 주위 당구대 위치, 친구의 목소리, 바닥의 재질, 그날의 나의 컨디션, 조명 --> 환경(environment) 목적(objective)는 에이전트가 받는 보상의 총합이다. 2.1 목적 : 1분 동안 큐대 안넘어뜨리기 상태 : [손바닥 위치, 손바닥 속도, 큐대 각도, 큐대 각속도]의 배열 행동 : (x,y,z) 손바닥 중심을 기준으로 벡터값 보상 : 큐대가 안 넘어지는 시간동안 +1 종료 : 큐대가 넘어지거나, 손바닥이 당구장 벽에 부딫이거나 최대 시간 1분에.. 2023. 7. 31.