이 문제는 무어와 맥케이브의 통계 실습 소개 5판에서 비롯되며 466-467pp에서 찾을 수 있습니다. 이 데이터는 46개의 다른 엔진에서 배출되는 세 가지 오염 물질의 배출로 구성됩니다. 여기에서 사용하는 데이터의 사본을 사용할 수 있습니다. 여기서 검토된 문제는 책에 있는 것과 는 다르지만, 책의 토론에 의해 동기를 부여한다. IM 산업 엔지니어와 나는이 배낭 문제를 이해해야합니다. 그러나 나는 그것을 할 수 없습니다. 어떻게 할 수 있습니까? 문제에 접근하는 또 다른 방법은 발견된 샘플 평균에 대한 실제 p-값을 계산하는 것입니다. 샘플 평균이 5.4보다 크므로 다음 코드로 찾을 수 있습니다. 로제타 코드 문제를 자신의 책에 인용하는 대신 로제타 코드 사이트의 더 많은 문제에 SAS 및 R 솔루션을 추가하지 않는 이유는 무엇입니까? 나는 당신이 환영 될 것이라고 확신합니다 – 그들은 나를 환영했고, 나는 어렵다!- 패디.

몬테 카를로 시뮬레이션을 만들어 이전 문제에 대한 답을 확인합니다. B <- 10000 시뮬레이션을 사용합니다. 힌트: 다음 코드를 사용하여 처음 네 게임의 결과를 생성합니다: 형식은 분석할 데이터를 설명하는 섹션과 함께 분석할 문제를 소개하고, 정의한 작업 흐름을 따릅니다. 여기서 설명하는 한 가지 실용적인 접근 방식은 추정치의 안정성을 확인하는 것입니다. 다음은 22명으로 구성된 그룹의 생일 문제와 같은 예입니다. 또는 모든 조합을 반복하지 않으려면 일반적인 선형 프로그래밍 문제를 설정하고 R에서 lpsolve를 사용하여 해결할 수 http://lpsolve.sourceforge.net/5.5/R.htm 그룹 수준의 여러 비교는 통계에서 까다로운 문제입니다. 유추. 표준 사례는 수행된 쌍별 테스트 의 수에 따라 통계적 유의성에 대한 임계값을 조정하는 것입니다.

예를 들어, 널리 알려진 Bonferonni 방법에 따르면 주어진 변수의 수단을 비교하려는 3 개의 다른 그룹이있는 경우 표준 유의 수준 (.05)을 수행 된 테스트 수로 나눕니다 (이 경우 3). 그리고 p-값이 .017(예: .05/3) 미만으로 떨어지는 경우 주어진 비교가 통계적으로 유의하다는 결론을 내릴 뿐입니다. 읽어 주셔서 감사합니다, 그리고 제안, 패디. 나 자신을 위해 말하기, 나는 컴퓨터 과학자 아니에요. 나는 로제타 코드에 의해 조금 협박하고 나는 그 지역 사회에 중요하다고 생각하는 것들을 해결하기 위해 유능한 생각하지 않습니다. 나는 닉이 위에서 언급 한 배낭 문제에 자신의 R 접근 방식을 기여했다고 생각하지만, 나는 틀렸을 수 있습니다. 이 섹션에서는 몬티 홀 문제와 생일 문제와 같은 이산 확률과 관련된 두 가지 인기 있는 예제를 설명합니다. R 코드를 사용하여 수학적 개념을 설명합니다. 계속하기 전에 다음과 같은 중요한 코드 줄에 대해 간략하게 설명합니다. 샘플 데이터 프레임을 취하고 데이터 집합의 각 행(date)에 대해 회귀 수식 및 매개 변수 추정값을 사용하여 예상 걸음 수를 계산하고 이 값을 시그마 모자 값과 함께 rnrom 함수에 전달하여 1000개의 샘플을 그리는 것입니다. 해당 날의 내재된 후방 분포입니다.

이 첫 번째 장에서 우리는 금융 및 위험에 대한 추가 작업에 대한 우리의 욕구를 자극하기 위해 R 프로그래밍의 몇 가지 측면을 검토 합니다. 여기서 첫 번째 단계는 재무 타임 시리즈, 위험 및 수익 요인 포트폴리오, 시장, 신용 및 운영 위험 측정, 위험 및 수익 의 집계 및 기본과 관련된 많은 문제를 해결할 수 있는 방법을 준비합니다. 변동성측정. 샘플링된 날짜 데이터 프레임은 다음과 같습니다(처음 10행 표시): 일산화탄소 데이터의 로그가 정규 분포와 더 유사하다는 강력한 증거가 있습니다.