하이퍼 스레딩은 단일 코어 성능을 줄입니다?
이것은 하이퍼 스레딩의 이점과 단점을 논의 할 때 종종 발생하는 질문입니다. HyperThreading은 단일 물리적 코어가 두 개의 논리적 코어 역할을 할 수있는 기술로 프로세서가 처리 할 수있는 스레드 수를 효과적으로 두 배로 늘리는 기술입니다. 그러나 하이퍼 스레딩이 실제로 성능을 향상시키는 지 또는 잠재적으로 단일 핵심 성능을 방해 할 수 있는지 여부에 대한 논쟁이 있습니다. 이 주제를 더 탐구합시다.
첫째, 하이퍼 스레딩이 어떻게 작동하는지 이해하는 것이 중요합니다. 단일 코어가 하이퍼 스레드가되면 각각 자체 지침 세트를 실행할 수있는 두 개의 가상 코어로 나뉩니다. 이를 통해 프로세서는 여러 스레드를 동시에 처리하여 전체 멀티 태스킹 성능을 향상시킬 수 있습니다. 그러나 이것이 반드시 단일 코어의 성능이 개선 될 것이라는 의미는 아닙니다.
실제로 일부는 하이퍼 스레딩이 실제로 단일 핵심 성능을 줄일 수 있다고 주장합니다. 이는 캐시 및 실행 장치와 같은 물리적 코어의 리소스가 하이퍼 스레딩에 의해 생성 된 두 논리적 코어간에 공유되기 때문입니다. 이로 인해 이러한 자원에 대한 경합이 증가하여 개별 스레드 실행 속도를 늦출 수 있습니다.
또한 HyperThreading은 여러 스레드를 활용하도록 최적화되지 않은 응용 분야의 성능을 크게 향상시키지 못할 수 있습니다. 예를 들어 많은 게임은 주로 단일 스레드이며 하이퍼 스레딩에서 눈에 띄는 개선이 보이지 않을 수 있습니다.
그러나 단일 코어 성능에 대한 하이퍼 스레딩의 영향은 특정 워크로드 및 프로세서 아키텍처에 따라 다를 수 있다는 점은 주목할 가치가 있습니다. 경우에 따라 HyperThreading은 프로세서가 사용 가능한 리소스를 더 잘 활용할 수 있도록하여 실제로 단일 핵심 성능을 향상시킬 수 있습니다.
하이퍼 스레딩이 단일 핵심 성능을 줄이는 지 여부에 대한 질문에 대한 확실한 답은 없습니다. 그것은 주로 특정 상황과 작업량에 달려 있습니다. 일부 사용자는 단일 코어 성능이 우선 순위 인 특정 시나리오에서 하이퍼 스레딩을 비활성화하도록 선택할 수 있으며, 다른 사용자는 증가 된 멀티 태스킹 기능을 활용할 수 있도록 떠나는 것을 선호 할 수 있습니다.
몇 가지 주요 테이크 아웃은 다음과 같습니다
- Hyperthreading은 단일 물리적 코어가 두 개의 논리적 코어 역할을 할 수있는 기술입니다.
- 하이퍼 스레딩은 프로세서가 여러 스레드를 동시에 처리 할 수 있도록 멀티 태스킹 성능을 향상시킬 수 있습니다.
- 일부는 하이퍼 스레딩이 공유 자원에 대한 경합을 증가시켜 단일 핵심 성능을 줄일 수 있다고 주장합니다.
- HyperThreading은 여러 스레드에 대해 최적화되지 않은 응용 프로그램의 성능을 크게 향상시키지 못할 수 있습니다.
- 단일 코어 성능에 대한 하이퍼 스레딩의 영향은 워크로드 및 프로세서 아키텍처에 따라 다를 수 있습니다.
- 하이퍼 스레딩이 특정 상황에 크게 의존하기 때문에 하이퍼 스레딩이 단일 핵심 성능을 줄이는 지 여부에 대한 확실한 답은 없습니다.
다음은 텍스트를 기반으로 한 몇 가지 질문입니다
- 하이퍼 스레딩이란 무엇입니까??
- 하이퍼 스레딩은 멀티 태스킹 성능을 향상시킵니다?
- 하이퍼 스레딩은 잠재적으로 단일 코어 성능을 줄일 수 있습니다?
- 모든 응용 프로그램은 하이퍼 스레딩의 혜택을 누리십시오?
- 단일 코어 성능에 대한 하이퍼 스레딩의 영향은 어떻게 다릅니 까??
- 하이퍼 스레딩이 단일 핵심 성능을 줄이는 지 여부에 대한 확실한 답이 있습니까??
- 하이퍼 스레딩 활성화 여부를 결정할 때 어떤 요인을 고려해야하는지?
- 게임은 일반적으로 여러 스레드에 최적화되어 있습니다?
- 하이퍼 스레딩은 전반적인 멀티 태스킹 성능을 향상시킬 수 있습니다?
- 하이퍼 스레딩의 잠재적 인 단점은 무엇입니까??
- 하이퍼 스레딩이 단일 핵심 성능에 유익한 지 또는 해로운 지에 대한 합의가 있습니까??
- 하이퍼 스레딩을 비활성화하면 단일 코어 성능을 향상시킬 수 있습니다?
- 하이퍼 스레딩은 가용 리소스의 활용을 향상시킬 수 있습니다?
- 게임을 위해 하이퍼 스레딩을 활성화하거나 비활성화해야합니다?
- 하이퍼 스레딩 성능 측면에서 AMD CPU가 Intel CPU보다 열등합니까??
- 하이퍼 스레딩은 게임에 대한 장점을 제공합니까??
Hyperthreading은 단일 물리적 코어가 두 개의 논리적 코어 역할을 할 수있는 기술입니다.
예, 하이퍼 스레딩은 프로세서가 여러 스레드를 동시에 처리 할 수 있도록하여 멀티 태스킹 성능을 향상시킬 수 있습니다.
예, 일부는 하이퍼 스레딩이 공유 자원에 대한 경합을 증가시켜 단일 핵심 성능을 줄일 수 있다고 주장합니다.
아니요, 하이퍼 스레딩은 여러 스레드에 대해 최적화되지 않은 응용 프로그램의 성능을 크게 향상시키지 못할 수 있습니다.
단일 코어 성능에 대한 하이퍼 스레딩의 영향은 워크로드 및 프로세서 아키텍처에 따라 다를 수 있습니다.
아니요, 특정 상황에 크게 의존하기 때문에 결정적인 대답은 없습니다.
하이퍼 스레딩 활성화 여부를 결정할 때 특정 워크로드 및 단일 코어 성능에 대한 우선 순위와 같은 요소를 고려해야합니다.
아니요, 많은 게임은 주로 단일 스레드이며 하이퍼 스레딩에서 눈에 띄는 개선이 보이지 않을 수 있습니다.
예, 하이퍼 스레딩은 프로세서가 여러 스레드를 동시에 처리 할 수 있도록하여 전반적인 멀티 태스킹 성능을 향상시킬 수 있습니다.
하이퍼 스레딩의 잠재적 인 단점에는 공유 리소스에 대한 경합 증가 및 개별 스레드 실행의 잠재적 둔화가 포함됩니다.
아니요, 특정 상황과 작업량에 크게 의존하기 때문에 합의가 없습니다.
경우에 따라 하이퍼 스레딩을 비활성화하면 공유 자원에 대한 경합을 줄임으로써 단일 핵심 성능을 향상시킬 수 있습니다.
예, 경우에 따라 하이퍼 스레딩은 프로세서가 더 잘 할당 할 수 있도록 가용 리소스의 활용을 향상시킬 수 있습니다.
특정 게임과 여러 스레드에 최적화되어 있는지 여부에 따라 다릅니다. 일부 게임은 하이퍼 스레딩의 혜택을 누릴 수 있지만 다른 게임은 눈에 띄게 개선되지 않을 수 있습니다.
AMD 및 Intel CPU의 성능이 특정 상황 및 워크로드에 따라 다를 수 있으므로이 질문에 대한 확실한 답은 없습니다.
HyperThreading은 여러 스레드에 대해 게임이 최적화되고 증가 된 멀티 태스킹 기능을 활용할 수있는 특정 시나리오에서 게임에 대한 장점을 제공 할 수 있습니다.
하이퍼 스레딩은 단일 코어 성능을 줄입니다
모든 쿠키를 수락함으로써 귀하는 서비스 및 사이트를 제공하고 유지 관리하기 위해 쿠키 사용에 동의하며, Reddit의 품질을 향상시키고, Reddit 컨텐츠 및 광고를 개인화하며, 광고의 효과를 측정합니다.
하이퍼 스레딩은 단일 코어 성능을 줄입니다
이것은 전혀 의미가 없습니다. 기본적으로 여기서 수행되는 모든 것은 Windows 또는 Unix 자체를 통해 처리 할 수 있습니다.
첫째 : 하이퍼 스레딩 자체가 대규모 성능 향상이므로 왜 어떤 이유로 든 왜 비활성화하겠습니까?? 제목에 문제가있는 경우 작업 관리자를 통해 처리 선호도뿐만 아니라 핵심 선호도를 설정할 수 있습니다. 멀티 스레딩의 작동 방식에 대한 개념이있는 경우, 최신 마이크로 프로세서가 클럭 사이클 당 여러 지침을 작성할 수 있으며 동일한 프로세스의 여러 스레드를 사용한다는 것을 알 수 있습니다.
이 도구의 목적에 대한 이유는 없으며 작업 관리자에서 모든 것이 수행 될 수 있습니다.
또한 이론적으로 칩의 처리 속도를 직접 늘리지 않고 성능을 향상 시키거나 프로세서 칩 자체의 지침의 활용 (또는 적응)을 개선하지 않아야합니다.
Visualizzazione di 16-30 해설 SU 48
6 러그 2015, 광석 23:21
Messaggio Originale Di Timdimmdrive:
Messaggio Originale Di 유리:
하이퍼 스레드가 게임에 도움이되거나 게임을 해치는 방법 및/또는 왜? 실제로 대부분의 게임은 지금 1 ~ 4 코어 만 사용하고 하이퍼 스레딩은 4 코어로 듀얼 코어 쇼를 만들어 져서 더 나은 방법에 따라 더 나은 방법에 따라 더 나빠질 수는 있지만 전선을 끄면 4 개의 스레드를 실행하는 2 코어 대신 2 코어를 끄는 데 도움이되지 않습니다 . 하이퍼 스레딩은 1 코어 실행 2 스레드를 통해 내려 가면서 나에게 설명되는 방법은 전자 전하가있는 조정 부품에 동일한 코어를 가질 수 없으므로 각각 4 개 대신 2 개의 스레드가 아닌 이유 4 개 부품이있는 이유는 한 번에 2 개의 실행을 가질 수 있습니다 ?
CPU 코어가 식료품 점에있는 체크 아웃 작업자라고 상상해보십시오. 이제 그녀는 1 명의 고객이있는 컨베이어 벨트 중 하나를 가지고 있다고 상상해보십시오. 계산원은 1 조각의 음식을 잡고 울린 다음 1 개를 더 잡습니다. 고객과 그들의 음식 = 게임/프로그램 및 계산원 = CPU 코어.
이제 동일한 계산원을 상상해 보지만 1 명의 고객이있는 1 개의 컨베이어 벨트 대신 계산원에게는 2 개의 컨베이어 벨트가 있으며 각각 자체 고객이 있습니다. 이제 계산원은 동시에 두 명의 고객을 반박 할 수 있습니다. 그러나 계산원은 한 번에 1 조각의 음식 만 울릴 수 있습니다. 그래서 계산원은 고객 A에서 1 조각의 음식을 가져 와서 고객 B에서 1 개, 고객 A 등의 다른 작품을 가져옵니다. 이것은 하이퍼 스레딩이 작동하는 방식입니다 (간단히 말해). 하이퍼 스레드는 두 번째 고객이있는 두 번째 컨베이어 벨트입니다.
이제 이제 100 조각의 음식을 사야한다고 상상해보십시오. 더 빠릅니다? 2 개의 별도 컨베이어 벨트, 각각 자체 계산원에게 가거나 컨베이어 벨트 2 개가있는 1 개의 계산원?
답은 2 개의 컨베이어 벨트이며 각각 자신의 계산원에게갑니다. 일명 2 CPU 코어. 1 계산서는 2 개의 컨베이어 벨트에 관계없이 한 번에 1 항목 만 확인할 수 있기 때문에 2 개의 계산원은 작업을 1로 두 번 수행 할 수 있습니다.
그렇기 때문에 선택할 수있는 능력이 있다면 항상 게임을 실제 CPU 코어와 하이퍼 스레드 가상 프로세서에있게하십시오.
좋아, 나는 당신의 음성을 얻는다. 그러나 애결절은 게임이 모듈로 만들어진 후에 게임이 본질적으로 AMD CPU에서 작동하지 않을 것이라는 것을 의미한다는 것을 의미한다? 모듈이 처음 2 개의 셀을 마지막 2 개 셀에서 분할하여 전체 코어의 1 모듈 내부에 2 개의 부분 코어를 만듭니다 ? 인텔의 하이퍼 스레딩은 인텔 하이퍼 스레딩이 2 라인의 셀 대신 한 줄에서 그것을 수행하는 것과 같은 개념과 동일합니다. 따라서 2 줄의 셀에서 수행 할 수있는 방법 1 셀에서 수행하는 것보다 어떻게 더 좋거나 나빠질 수 있는지? 아니면 AMD CPU가 모두 모든 인텔 CPU보다 열등하다는 것을 의미합니까? ?
나는 당신의 ananolgy를 얻습니다. 그렇다면 전자식 이외의 전자식이라면 적용 될 것입니다. 그러나 한 셀에서 다른 셀에서 1V ussualy의 전압을 전달하는 셀 라인은 1 라인을 사용하여 지시를 할 수 없으며 AMD는 2 줄을 사용하여 1 줄의 각 절반을 호출하여 1 줄을 호출 할 수 없을 정도로 작동하지 않습니다. 소프트웨어 수준의 사고 수준에서 의미가 있습니다.
그것이 너무 잘 작동한다면 내가 이해하지 못하는 이유와 이유를 설명하고 이해할 때까지 구매하지 않을 것입니다.
6 러그 2015, 광석 23:30
^ IM도 이유를 인용하지 않을 것입니다..
AMD FX는 셀을 분할하지 않습니다,
AMD FX 칩은 모듈 식베이스입니다. 예, 2 개의 물리적 코어가있는 방법 모듈 식. FPU 등과 같은 다이의 일부 측면을 공유하는 코어는 어떻게..
AMD FX 용량은 실제로 8 개의 물리적 코어, 코어 당 1 개의 스레드가 있습니다..
Intel HT의 것은 코어 당 2 스레드를 복용한다는 것입니다.. 그리고 두 스레드는 코어와 CPU의 모든 측면을 공유해야합니다. AMD FX OUT이 다중 스레드, 멀티 코어 애플리케이션에서 사전 형성 된 이유 중 하나입니다..
Beacuse AMD FX Cores는 단일 스레드, 프리 성적으로 인텔에 의해 분류되지만 모듈 식으로 FPU ECT를 공유해야합니다. HT가 비활성화 된 경우에는 사실입니다.. AMD FX 칩에서 코어를 비활성화하여 모듈 식 1 당 1 코어를 일치시키고 L3 캐시를 제외하고는 공유 할 수 없습니다
AMD의 경우 이것은 절반 Coreboost가 더 빠른 것보다 전체 코어 부스트 인 가장 큰 이유 중 하나입니다.
내 CPU 8120 정상은 3입니다.1GHz, 전체 코어 (8 코어)는 3입니다.4GHz 및 반 코어 (4 배, 모듈 식 1)는 4입니다.0GHZ
인텔에서 HT를 비활성화하면 칩을 더 많이 OC보다 더 활성화 할 수 있습니다.
Ultima modifica da maddoggyca; 6 러그 2015, 광석 23:36
7 Lug 2015, 광석 1:34
나는 AMD “Split”셀을 측면으로하지 않는다고 AMD는 1 단계와 2 단계의 한 줄을 사용한 다음 3 단계와 4 단계의 다른 줄을 사용한다고 말했지만 Intel은 1, 2, 3 및 4 단계에 동일한 라인의 실리콘 합금을 사용하여 루프를 뒤로 활성화하지 않고 루프 백이 왜 AMD 모듈이 작동하는 방식과 직선 선이 어떻게 하이퍼 스레딩이 작동 하는가.
HT가 게임 프리 포뮬레이션 프로브 비를 저하시키는 이유를 여전히 알지 못합니다. Elecrtic Charge는 Hyperthreading의 유무에 관계없이 동일하게 될 것입니다. AMD 코어와 동일 코어를 수행하는 전기 전하.
또한 단일 코어 프리 형식은 Intel에서는 단일 스레드가 아니라 단일 코어가 더 좋습니다. 단일 코어는 아무것도 아니기 때문에 인텔이 아닌 단일 스레드는 클럭 사이클 당 멀티 스레드를 수행하지 않습니다.
나는 그것이 나에게 의미가 없다는 것이 유감이지만, 그것이 사실이라면, 그것이 3GHz의 속도에 비해 고속으로 무엇이든, 게임이 없기 때문에 아무런 속도의 다른 속도를 볼 수 없기 때문에 문제가 멈 춥니 다. Bo는 하이퍼 스레딩과 잘 작동하지 않습니다.
7 Lug 2015, 광석 2:03
흠 AMD와 인텔은 클록주기 당 멀티 스레드를 수행하지 않습니다. 클록 사이클 당 HT 활성화 복용량 2 스레드가있는 인텔 만.. 또한 시계 사이클도 마찬가지입니다 .000000001.. 일명 진정으로 빠릅니다. *이것은 MHZ, GHZ가 들어옵니다. GHZ가 빨라질수록 클록 사이클이 빨라집니다. 사이클이 빨라질수록 CPU 안팎에서 더 많은 스레드를 의미합니다.. 일명 데이터는 더 빨리 칼라가 캘리스트되고 같은 시간에 더 많은 데이터가 캘업되면 CPU가 느려집니다
설명 클록 사이클, 스레드 사이클 및 인텔 ht를 따르는 것이 가장 좋고 대부분의 스마일 다이어그램입니다 .
단일 코어, 단일 스레드 = 1 사이클, 스레드가 시작되고 동시에 시계 사이클이 시작/종료됩니다
단일 코어, 하이퍼 스레드 = 1 사이클.. ht는 1 개의 코어가 2 개의 스레드를 실행할 때, 시계 사이클을 구걸 할 때 시작하고 시계 사이클의 끝에서 끝납니다. 두 번째 스레드는 클록 사이클을 반쯤 시작하고 다음 사이클을 통해 반쯤 끝납니다.. (반복하다)
인텔 ht 복용량은 동시에 2 스레드를 시작하지 않거나 복용량이 시계 사이클을 구걸 할 때 2 스레드를 시작하거나 동시에 2 개의 스레드를 마무리합니다. 이론의 한 스레드가 다른 스레드가 CPU의 나머지 부분을 사용하여 마무리까지 기다릴 필요가 없다는 솔로 이유에 대해 설정했습니다. 이것이 사실이 아닙니다 .. 스레드 콜라이트는 개인적으로 그것에 대해 보거나 알지 못하지만 항상 발생하지만 PC 또는 OS에 영향을 미치지 않으며 전체 시스템에 1 : 10000000000000000의 확률이 있습니다.. 그러나 복용량은 여전히 단일 코어, 단일 스레드 작업이 처리 할 필요가없는 사전 성 문제를 유발합니다
이것이 HT 비활성화 된 인텔 칩에서 게임과 단일 코어 애플리케이션이 조금 더 빠르게 실행되는 이유 중 하나입니다. 스레드가 끝날 때까지 기다릴 가능성이 없습니다.
멀티 코어가 활성화 된 게임의 경우, 사이클 당 1 스레드를 처리하는 전용 코어에 오프로드하는 것이 좋습니다..
사이클이 얼마나 빠르고, 전기/데이터가 하드웨어를 통해 얼마나 빨리 실행되는지에 대해 생각할 때 모든 redunent 및 약간 리커치가 들립니다. 그러나 사람들은 실제로 가능한 가장 빠른 속도를 얻는 것에 관심을 갖습니다. 몇 마일의 이득이 있더라도.
Ultima modifica da maddoggyca; 7 Lug 2015, 광석 2:23
7 러그 2015, 광석 3:55
좋아, 나는 당신이 하이퍼 스레딩이 잘못된 것을 가지고 있다고 생각합니다. 하이퍼 스레딩. 예 1 클럭 사이클은 1 나노 초 정도 정도 매우 빠르지 만 1 클럭 사이클의 경우 1 클럭 사이클에서 멀티플 명령을 수행 할 수 있으므로 단일 코어 사전 형성에서 인텔보다 AMD보다 더 나은 방법의 일부는 멀티 코어 프리 형식에서 더 나은지 확실하지 않습니다. 프로그램이 코어의 유일한 프로그램이라면 예, 해당 코어를 사용해야 할 때마다 핵심을 사용할 수있을 것입니다. 실제 핵심이라면 2003 년 부터이 오래된 오래된 트릭을 사용하는 것이 더 이상 좋지 않다고 말하지 않으면 OS와 CPU 자체가 이미 최소한의 속도에 따라 최소화 할 때 더 이상 사용하는 이점을 보지 못합니다.
7 Lug 2015, 광석 4:08
다음은 실제 CPU의 내부 작품의 그림과 내가 말하는 이유입니다
http : // www.CBtricks.com/radios/대통령/조지/그래픽/George_main_sch.gif
당신의 사진은 전자 공학을 이해하지 못하고 간단한 용어로 넣을 필요가있는 사용자들에게 지나치게 단순화되어 있지만, 당신이 말하는 것은 (George) CPU에서 시계 사이클 당 mulple 명령을 실행할 수 있기 때문에 의미가 없습니다. CPU는 매우 빠르게 진행하는 CPU가 아니며 인텔과 AMD가 매우 어려운 형태를 만들지 만 Diastram Shite에서 단순한 CPU 작품이 아니라는 것입니다
당신의 논리가 직선 원으로 들어가는 경우, 그렇습니다. 그러나 사이클이나 정의 된 패턴이 전혀 없으면 나노초의 것들에서 저항 내부의 inonized 원자의 양에 의해 정의 된 방법을 제외하고는 diffenreltyand hyperthreading ussualy가 사전 형식을 향상시킵니다 . 예, 듀얼 코어 게임을 실행하고 두 번째 코어가 첫 번째 코어 전에 명령을 완성한 경우 두 번째 코어가 첫 번째 코어와 동일한 라인에 있지만 그 뒤에는 같은 속도로만 진행되기 때문에 블루 스크린을 얻을 가능성이 높습니다 . Morden CPU는 BIOS에 달리 설정하지 않는 한 코어는 Diffenret 속도로 이동할 수 있습니다.이 프로그램은 최대 속도로 모든 코어를 실행하는 메시지를 보내는 것이 “문제”를 제거하고 속도를 최대 속도 / 상장 속도로 증가 시키거나 대부분의 CPU가 3GHz에서 실행하지 않거나 마케팅되는 주식 속도로 표시됩니다.2GHz ~ 1.CPU 수명을 보존하고 에너지 사용을 보존하기 위해 8GHz.
새로운 또는 마지막 Gen CPU를 실행하는 경우 “몇 밀리 스코드 이득이더라도”의 마지막 부분에서 100%의 주식 속도가 3이됩니다.0GHz ~ 3.2GHz의 차이를 최대 몇 나노 초의 이득. 12 나나 노코 컨드 (Nanaoseconds) whcih는 마지막 CPU 세대 CPU에서 실행되거나 재고 속도로 인해 인간 뇌에 의해 실행 되면서이 프로그램을 얼마나 절약 할 수 있는지에 대한 최선의 사례입니다. 인간 뇌에 의해 스톡 속도가 약 150miliseconds에서 200 밀리 초가 필요합니다.
이 프로그램은 저급 하드웨어 용으로 만들어 졌으므로 나에게는 당신을위한 것이 아니라 나를 위해서는 아닙니다.
7 러그 2015, 광석 7:07
Messaggio Originale Di Timdimmdrive:
대답은 정말 쉽습니다
하이퍼 스레딩은 실제 CPU가 아닙니다. 대신, 그것은 가상화 된 CPU입니다. 한 번에 2 개의 CPU 스레드 만 사용할 수있는 게임을 플레이하는 경우 1 개의 실제 CPU 코어와 1 가상 CPU 코어에 비해 2 개의 실제 CPU 코어를 제공하는 성능이 훨씬 향상됩니다. 따라서 CPUCORES가하는 일은 게임이 하이퍼 스레딩을 사용하지 않고 실제 코어 만 사용하는 것입니다. 참고 : 이것은 소프트웨어의 옵션입니다. 게임별로 활성화/비활성화 할 수 있습니다. HyperThreading이 무엇인지에 대한 잘 읽었습니다. https : // en.위키 백과.조직/위키/하이퍼 스레딩
“모든 것은 작업 관리자에서 수행 할 수 있습니다. “
이것은 맞지 않습니다. cpucores가 무엇을 더 설명 할 것인지에 대한 비디오와 설명 중 일부. 예를 들어, 실제 게임 자체만을 만지는 것이 아닙니다. OS 프로세스가 실행되는 방식, 게임 비 게임 프로세스, 게임 자체를 식별하고 수정하고 모든 것을 사용하기 쉬운 스팀 통합 프로그램으로 랩핑합니다.
“이론적으로 칩의 처리 속도를 직접 늘리지 않고 성능을 향상시키는 방법이 아니다”
이것은 맞지 않습니다. 그것을 이해하는 가장 쉬운 방법은 이것입니다. 게임에 더 좋습니다? 코어의 70% CPU 또는 코어의 100% CPU? 이것이 바로 cpucores가 할 일입니다. 그것은 어떤 프로세스가 무엇인지 정리 한 다음 Steam 게임에 거의 100% 깨끗하고 사용하지 않는 코어를 제시합니다. (cpucores의 다른 특징들 중에서).
실제 게임에서 사용중인 CPUCORES에 대한 몇 가지 비디오가 있습니다. http : // steamcommunity.com/app/384300/토론/
나는 그것이 당신이 물건을 이해하는 데 도움이되기를 바랍니다.
팀, 저를 위해 몇 가지를 자세히 설명 해주세요. CPUCORES가 70% 코어에서 실행되는 게임을 정확히 어떻게 허용합니까 (100% 코어를 사용하지 않는 적절하게 구축 된 게임을 본 적이 없음) 100% 코어에서 실행됩니다? 프로그램이 더 많은 CPU로드를 사용하도록 강요 할 수 없습니다. 나는 프로세스의 폐쇄가 게임 성능에 영향을 미친다고 믿지 않는다 (나는 과거에 그 이론을 여러 번 테스트했다). 또한 게임에 인접 해있는 추가 프로세스의 95%가 Windows에 의해 Ran By Ran이 필요하며 오디오 관리자, 드라이버 등의 프로그램 등과 같은 추가 프로세스가 필요합니다. 또 다른 예 : GTA V를 출시 할 때 게임을하기 위해서는 소셜 클럽 프로세스가 필요합니다. 그러나 게임시 실행중인 유일한 “추가”프로세스는 다운로드 관리자 인 FooBar2000 및 MSI 하드웨어 스위치 콘솔입니다. 나는 이것을 쓰는 동안이 이론을 테스트했으며 추가 프로세스를 마친 후 게임의 성능이나 부드러움에 전혀 차이가 없음을 알았습니다.
그러나 나는 하이퍼 스레딩은 물건을 불안정하게 만드는 경향이 있습니다. 나는 하이퍼 스레딩이 성능을 저하시킬 것이라는 데 동의하지 않습니다. 모든 하이퍼 스레딩은 프로세서의 로딩을 효율적으로 관리하는 것입니다. 사진/비디오 편집기 및 비디오 게임과 같은 심하게로드하는 응용 프로그램은 하이퍼 스레딩을 활성화하여 실행하는 데 적합하며 어떤 이유로 든 비활성화하면 수정보다 더 많은 문제가 발생할 수 있습니다.
또한 하이퍼 스레딩을 비활성화하면 텍스처 로딩이 심한 게임 (예 : TES : Skyrim)이 적재 시간에 큰 타격을 입히게하는 어딘가에 (이것에 대한 개인적인 경험이 없음) 읽었습니다.
팀, 저는 숙련 된 PC 사용자입니다. 내 경험은 10 년 이상 이와 같은 주제에 대한 끝없는 시간을 계산하지 않습니다. 내가 모르는 것을 말해 줄 필요가있어.
Ultima Modifica da Ketonasarus; 7 러그 2015, 광석 7:20
7 러그 2015, 광석 13:01
핀란하게 하이퍼 스레딩에 대해 그것을 얻는 사람 . 또한 위의 링크에서 CPU가 3GHz와 같이 빠르거나 더 빠르면 하이퍼 스레딩을 비활성화하면 오버 클로킹을하지 않으면 성능을 향상시키지 못하지만이 프로그램은 오버 클럭킹에 적합하지 않습니다.
그리고 네, 당신의 요점을 보지만, 내가 이해하는 방법에서 프로그램은 Turboboost가 기본적으로 속도의 버스트를위한 자체 오버 클록이되도록 강요하고,이 프로그램을 사용하더라도 100%의 코어를 사용할 수 없다고 말한 것처럼 말한 대로이 프로그램은 기본적으로 속도의 버스트를위한 자체 오버 클럭입니다 . 그러나 Windows를 생각하고 말하면 CPU가 추가 기능을 사용하여 재고 속도보다 빠르게 진행되도록 CPU를 속일 수 있습니다.
Ultima modifica da yumri; 7 Lug 2015, 광석 13:05
8 러그 2015, 광석 11:41
Messaggio Originale Di GS-R:
모든 하이퍼 스레딩은 프로세서의 로딩을 효율적으로 관리하는 것입니다. 사진/비디오 편집기 및 비디오 게임과 같은 심하게로드하는 응용 프로그램은 하이퍼 스레딩을 활성화하여 실행하는 데 적합하며 어떤 이유로 든 비활성화하면 수정보다 더 많은 문제가 발생할 수 있습니다.
예. 그것이 “모든 것이해야 할 것”이지만, 나는 당신이 실제 ‘로딩’이 무엇인지, 그것이 작동하는지 또는 작동하지 않는 방식을 잘못 해석하는 몰래 의심을받습니다.
하이퍼 스레딩이하는 일은 물리적 코어를 두 개의 논리적 코어로 나누는 것입니다. 이 두 논리적 코어는 별도의 실행 상태를 가지고있어 ~할 수 있다 작업을 병렬로 실행하지만 시스템 버스 또는 CPU 메모리 캐시와 같은 리소스를 공유하고 경쟁해야합니다 항상 할 수는 없습니다 동시에 실행됩니다.
그것은 이해하는 것이 매우 중요합니다. 스케줄 트릭을 활용하기 위해 특정 방식으로 작성된 소프트웨어를 실행해야합니다.
가장 간단한 예는 하나의 논리적 코어에서 무거운 계산 작업을 실행하는 하나의 스레드이며, 자매 논리적 코어는 메인 RAM으로 데이터를 플러시하고 추가 계산을 위해 새로운 데이터를 가져 오는 것입니다.
어떤 유형의 소프트웨어가 대부분 그런 식으로 작동하는지? 데이터 스트림에서 계산을 수행하는 소프트웨어. 이러한 유형의 표준 예는 오디오 및 비디오 인코딩 또는 디코딩 소프트웨어입니다.
실제로 대부분의 소프트웨어는 두 개의 논리적 코어가 완전히 분리 된 방식으로 작동 할 수 있도록 충분히 병렬화되지 않습니다. 충돌이있을 것입니다. 포장 된 영화 Theather에서 청중의 집단 손을 믿을 수있는 것보다 한 초 안에 많은 것들이 더 많이.
그러나 여러 개의 단기간의 충돌, 분리, 병렬 작업이 평행 작업이 전혀없는 것보다 더 빠릅니다. 따라서 하이퍼 스레딩으로 뮬리플 스레드를 실행하는 것은 여전히 하이퍼 스레딩없이 한 번에 단일 스레드 만 실행하는 것보다 더 빠릅니다.
그래서 그것이 게임에 어떤 영향을 미칩니다?
잘. CPU가 사용 가능한 물리적 코어 수와 게임이 생성되는 동시 스레드 수에 가장 큰 부분에 달려 있습니다.
오래된 게임은 일반적으로 싱글 스레드이므로 멀티 스레딩에 대한 잘 이해하지 못하는 개발자를 시작함으로써 많은 인디 게임이 있습니다 (또는 멀티 스레딩이 필요하지 않은 가벼운 무언가를 구축하고 있습니다). 그러한 게임에서 가장 많은 성능을 얻으려면 논리적 프로세서 중 하나에서 게임의 단일 스레드를 실행하고 다른 모든 것을 가능한 한 많이 유지하려고합니다. 하나의 논리적 프로세서가 다른 사람이 원하는 것이 절대 차단되지 않도록하십시오.
멀티 스레드 게임 및 멀티 코어 시스템의 경우 동일한 원칙이 있습니다. 이상적으로는 게임의 각 스레드가 하나의 논리적 프로세서에서 실행되고 자매가 활동을 자유롭게 유지하여 첫 번째 차단을 차단할 수 없습니다.
흥미로운 곳은 게임에 스레드가있는 것보다 물리적 코어가 적을 때입니다.
이 경우 하이퍼 스레딩이 활성화 된 상태에서 실행하는 것이 매우 유리할 수 있으며 전체 부하 하에서 물리적 코어 아래에 짝을 이루는 두 논리 코어가 모두 유리할 수 있습니다. 논리적 프로세서가 때때로 충돌하고 서로 속도가 느려질지라도 일반적으로 전체 평행으로 실행되는 기간이 있으며 전체적으로 동일한 코어에서 두 개의 스레드를 예약하고 컨텍스트 전환의 전체 비용을 지불하는 것보다 전체적으로 더 나은 성능이 뛰어납니다.
정확한 이점은 여전히 게임마다 다릅니다. 각 스레드가 서로 얼마나 잘 유지되는지에 따라 다릅니다. 또한 특정마다 다릅니다 세대 사용중인 CPU의. 인텔은 각 세대의 CPU에서 최적화 및 스케줄링 트릭을 수행하는 데 점점 더 좋고 더 나아졌으며 최신 i3 또는 i7은 평균적으로 i3 또는 i7의 이전 세대보다 동일한 소프트웨어를 실행하는 충돌이 적을 것입니다.
이전 게임
멀티 스레딩을 사용한 것은 일반적으로 구형 CPU가 일반적으로 두 개의 물리적 코어 만 있었기 때문에 일반적으로 두 개의 동시 스레드 만 사용합니다. 이 게임을 i3에서 실행할 때에도 하이퍼 스레딩이 활성화되면 (2 개의 물리적 코어에서 4 개의 논리적 코어를 생성) 충돌로 인해 성능을 줄일 가능성이 높습니다. 별도의 물리적 코어에서 실행될 두 스레드를 명시 적으로 예약하지 않는 한. Windows OS는 Windows 7까지 어떤 논리적 코어가 어떤 논리적 코어를 식별 할 방법이 없었기 때문에 대부분의 오래된 게임은이 작업을 수행하지 않습니다. Cpucores와 같은 소프트웨어가 당신을 위해 그것을 강요 할 수있는 곳입니다.
현대 게임
일반적으로 4 개의 코어를 사용합니다. 그 이유는 조금 더 다양합니다. 게임 엔진 개발자가보다 세분화 된 분할을 관리 할 수 없거나 rnodern 게임 콘솔이 4 개의 코어 만 사용할 수 있고 게임은 멀티 플랫폼 릴리스이기 때문일 수 있습니다.
그 게임을 실행하는 i3의 경우 일반적으로 좋은 하이퍼 스레딩을 활성화하고 4 개의 논리적 코어를 모두 최대로드하여 해당 시스템의 최대 병렬화량을 달성하는 아이디어. i7 (4 개의 물리적 코어, 8 개의 논리적 코어)의 경우, 별도의 물리적 코어에서 스레드를 분리하지 않는 한 하이퍼 스레딩을 활성화하는 것은 일반적으로 나쁘다.
현대 엔진에 작성된 현대 게임은 일반적으로 코어가 논리적 인 코어와 그 중 쌍을 이루는 방법을 알고 있으며 이러한 종류의 정보를보고 할 수있는 최신 Windows OS에서 실행될 때 그렇게 할 것입니다. (즉, Windows 7 이상.) IIRC Unreal Engine 3에는 이러한 유형의 기술이 있습니다.
그러한 엔진에 작성된 게임을 처리 할 때, 게임이 이미 그 자체를 처리 할 것이기 때문에 CPUCORES에서 ‘하이퍼 스레딩을 비활성화'(읽기; 논리 프로세서를 분리하기 위해 게임을 분리)하는 것은 의미가 없습니다.
하이퍼 스레딩은 단일 코어 성능을 줄입니다
Reddit과 그 파트너는 쿠키와 유사한 기술을 사용하여 더 나은 경험을 제공합니다.
모든 쿠키를 수락함으로써 귀하는 서비스 및 사이트를 제공하고 유지 관리하기 위해 쿠키 사용에 동의하며, Reddit의 품질을 향상시키고, Reddit 컨텐츠 및 광고를 개인화하며, 광고의 효과를 측정합니다.
비 필수 쿠키를 거부함으로써 Reddit은 여전히 특정 쿠키를 사용하여 플랫폼의 적절한 기능을 보장 할 수 있습니다.
자세한 내용은 쿠키 통지 및 개인 정보 보호 정책을 참조하십시오 .
[해결] 하이퍼 스레딩은 성능에 영향을 미칩니다?
오래된 브라우저를 사용하고 있습니다. 이 웹 사이트 나 다른 웹 사이트를 올바르게 표시하지 않을 수 있습니다.
대체 브라우저를 업그레이드하거나 사용해야합니다.
망고이
2021 년 11 월 8 일 61 2 35
내 친구가 묻습니다. i5 4690과 i7 3770 사이에 어느 것이 더 좋습니다. i7에는 하이퍼 스레딩이 있고 i5는 그렇지 않습니다. i5가 i7보다 나쁩니다?
그는 저렴한 게임 PC를 만들고 싶어 하며이 PC는 친구의 형제를위한 생일 선물로 선물을받을 것입니다. 그래서 답이 도움이되기를 바랍니다
kanewolf
나와 내 친구는 소켓 차이를 알고 있습니다. 우리는 하이퍼 스레딩이 성능에 도움이 될지 알고 싶습니다.
대부분의 소프트웨어의 경우 그렇습니다. 물리적 CPU를 완전히 활용하기 위해 작성된 소프트웨어. 상용 소프트웨어는 이런 식으로 작성되지 않습니다. 왜? 상용 소프트웨어는 수십 가지 다른 CPU에서 실행해야하기 때문에. 예를 들어 YouTube 용 사용자 정의 소프트웨어를 작성하는 경우 특정 CPU에 대해 최적화 할 수 있습니다. YouTube에는 수천 개의 동일한 하드웨어가 있습니다. 해당 하드웨어를 최적화 한 다음 벤치마킹을 통해 하이퍼 스레딩 켜짐 또는 끄기가 더 나은 성능이 있는지 확인할 수 있습니다. 기본 설정 단계가있는 시스템의 엔지니어였습니다.
lutfij
타이탄
중재자
2009 년 10 월 7 일 49,405 3,748 153,390
시스템에 세금을 부과하고 싶은 게임은 어떤 종류의 게임을?
드레아.Drechsler
챔피언
2017 년 10 월 16 일 9,449 2,474 52,290
그것이 성과에 얼마나 영향을 미치는지 논쟁의 여지가 있고 조건부이지만 다른 모든 것이 동일합니다. 그렇습니다.
Johnbonhamsghost
거룩한
2016 년 1 월 14 일 6,970 1,078 49,190
하이퍼 스레딩이 성능에 영향을 미칩니다?
모두 관련된 특정 소프트웨어에 따라 다릅니다.
일부는 하이퍼 스레딩, 더 전용 CPU 코어, 일부 단일 코어 만 사용합니다.
이 오래된 3 세대 또는 4 세대 CPU에 대해 어떤 가격을 지불 할 것인가?
그는 구축하고 싶어합니다
이 유형의 대화는 다음과 같습니다 언제나 실제 구매자/건축업자를 사용하면 더 쉽습니다.
이 스레드를 통해 스스로 연락하거나 새 스레드를 만들어.
망고이
2021 년 11 월 8 일 61 2 35
시스템에 세금을 부과하고 싶은 게임은 어떤 종류의 게임을?
Minecraft, GTA V, CS Go와 같은 게임, 그런 종류의 게임
망고이
2021 년 11 월 8 일 61 2 35
모두 관련된 특정 소프트웨어에 따라 다릅니다.
일부는 하이퍼 스레딩, 더 전용 CPU 코어, 일부 단일 코어 만 사용합니다.
이 오래된 3 세대 또는 4 세대 CPU에 대해 어떤 가격을 지불 할 것인가?
이 유형의 대화는 다음과 같습니다 언제나 실제 구매자/건축업자를 사용하면 더 쉽습니다.
그들이이 스레드를 트로프하거나 새 스레드를 만들어 스스로 연락하도록하십시오.
둘 다 중고 CPU는 약 20 달러, i5는 21 달러, i7은 지역 컴퓨터 상점에서 24 달러입니다
Johnbonhamsghost
거룩한
2016 년 1 월 14 일 6,970 1,078 49,190
I5는 21 달러이고 i7은 24입니다
둘 다 구매하십시오.
망고이
2021 년 11 월 8 일 61 2 35
둘 다 구매하십시오.
그는 PC에서 어느 것을 사용해야하는지?
그리고 언급하는 것을 잊었습니다. 그는 그의 오래된 GTX 950과 짝을 이루는 CPU를 찾고 있습니다
Nighthawk117
존경합니다
2021 년 9 월 27 일 2,029 633 10,540
내 친구가 묻습니다. i5 4690과 i7 3770 사이에 어느 것이 더 좋습니다. i7에는 하이퍼 스레딩이 있고 i5는 그렇지 않습니다. i5가 i7보다 나쁩니다?
그는 저렴한 게임 PC를 만들고 싶어 하며이 PC는 친구의 형제를위한 생일 선물로 선물을받을 것입니다. 그래서 답이 도움이되기를 바랍니다
하이퍼 스레딩은 대부분의 현대 게임에서 상당한 차이를 만듭니다. 3770은 더 나은 CPU이지만 동일한 소켓을 사용하지 않습니다.
망고이
2021 년 11 월 8 일 61 2 35
하이퍼 스레딩은 대부분의 현대 게임에서 상당한 차이를 만듭니다. 3770은 더 나은 CPU이지만 동일한 소켓을 사용하지 않습니다.
나와 내 친구는 소켓 차이를 알고 있습니다. 우리는 하이퍼 스레딩이 성능에 도움이 될지 알고 싶습니다.
Nighthawk117
존경합니다
2021 년 9 월 27 일 2,029 633 10,540
나와 내 친구는 소켓 차이를 알고 있습니다. 우리는 하이퍼 스레딩이 성능에 도움이 될지 알고 싶습니다.
그것은 소프트웨어에 따라 다르지만 일반적인 규칙으로서의 경험에서 항상 하이퍼 스레드 칩을 선택합니다. 단일 핵심 차이는 작고, 하이퍼 스레딩은 더 나은 PC 경험을 제공하고 현대 게임에서 더 매끄러운 게임 플레이를 만들 것입니다. 예를 들어 Battlefield v를 재생하고 싶다면 3770이 8 개의 스레드를 모두 사용하기 때문에 더 나은 칩입니다. 이 게임 중 일부는 이전 4C/4T 칩에서는 그다지 부드럽 지 않습니다.
kanewolf
타이탄
중재자
2013 년 5 월 29 일 35,821 2,774 153,790
나와 내 친구는 소켓 차이를 알고 있습니다. 우리는 하이퍼 스레딩이 성능에 도움이 될지 알고 싶습니다.
대부분의 소프트웨어의 경우 그렇습니다. 물리적 CPU를 완전히 활용하기 위해 작성된 소프트웨어. 상용 소프트웨어는 이런 식으로 작성되지 않습니다. 왜? 상용 소프트웨어는 수십 가지 다른 CPU에서 실행해야하기 때문에. 예를 들어 YouTube 용 사용자 정의 소프트웨어를 작성하는 경우 특정 CPU에 대해 최적화 할 수 있습니다. YouTube에는 수천 개의 동일한 하드웨어가 있습니다. 해당 하드웨어를 최적화 한 다음 벤치마킹을 통해 하이퍼 스레딩 켜짐 또는 끄기가 더 나은 성능이 있는지 확인할 수 있습니다. 기본 설정 단계가 BIOS에서 하이퍼 스레딩을 비활성화하는 시스템의 엔지니어였습니다.
최대로 수행 해야하는 특정 소프트웨어가 있으면 두 가지 방법 모두 벤치마킹하고 최고의 성능으로 실행됩니다.
하이퍼 스레딩은 코어의 두 스레드를 느리게합니다?
이것은 이미 다른 스레드에서 대답 할 수 있지만 여기서 어쨌든 간다. 8 스레드의 하이퍼 스레딩이있는 4 개의 코어 프로세서가 있다고 가정 해. 인텔 i7-4770K를 예로 들어 봅시다. 단일 코어에서 단일 코어에서 하나의 스레드 만 실행하는 것과 비교하여 단일 코어에서 동시에 실행되는 두 개의 스레드가 동시에 실행되었다는 사실을 수행합니다. 시스템 넓은 처리량이 아닌 단일 스레드의 순 처리량에 대해 이야기하고 있습니다. 프로세서가 하이퍼 스레딩 모드에서 실행중인 경우 캐시, 실행 장치, 파이프 라인 등과 같은 공유 리소스를 관리하는 데 많은 시간을 소비 해야하는 것 같습니다. 다시 말해, “스레드 당 성능”은 4 개의 코어와 4 개의 스레드가있는 CPU보다 4 개의 코어와 4 개의 스레드가있는 CPU보다 작을 것 같습니다. 깨달고 설명하고 정교하게 해주세요.
더 많은 옵션
레드 리더
Ars Legatus Legionis
구현 방법과 스레드가 실제로 수행하는 작업에 따라 다릅니다 (E.g. 그들은 서로의 기억이나 그와 비슷한 것을 퇴거시켜 캐시와 싸우는가). 그러나 일반적으로, 아니요. 캐시 등과 같은 것들은 하드웨어의 관점에서 실제로 “관리”되지 않습니다. 메모리 값은 어디에서 왔든 메모리 값입니다. 파이프 라인의 지침을 위해서는 각 스레드가 참조하는 등록 세트를 추적해야하지만 (각 스레드가 자체적으로 가질 것이기 때문에) 최신 X86 프로세서에서는 주문 실행으로 인해 스레드 레지스터의 많은 사본이 있어야하므로 스레드 레지스터의 많은 사본이 있어야합니다.
SMT에 대한 흥미로운 점은 자연스럽게 넓은 슈퍼 스칼라 프로세서가 이미해야 할 일에 얼마나 적합한 지입니다.
더 많은 옵션
Tom Dunkerton
ars praefectus
감사합니다 Redleader. 왜 그런지 잘 모르겠지만, 하이퍼 스레딩이없는 4 개의 코어는 하이퍼 스레딩이있는 듀얼 코어보다 스레드 당 더 빠를 것이라고 생각합니다. 내가 무엇을 놓치고 있는지?
더 많은 옵션
브리즈
ars praefectus
하이퍼 스레딩이 측정 값으로 성능을 저하시키는 곳으로 가득 찬 유일한 사례는 수학 수학입니다. 잘 정리 된 데이터를 크 런칭하는 경우 핵심을 바쁘게 유지할 수 있습니다. 그리고 많은 작업을한다면 캐시에 너무 커질 수 있습니다. 따라서 계산을 코어에 전파하여 모든 사람의 캐시를 얻으려고합니다 (동시에 커뮤니케이션을 최소화합니다. 그것은 예술입니다!)). 일반적으로 HyperThreads가있는 경우 코어 당 ‘무엇이든’대역폭의 절반이 있지만 많은 사람들이 대역폭에 따른 코드를 자주 실행하는지 확실하지 않습니다.
코드가 너무 빨라서 코드가 매우 신중하게 조정되지 않는 한 코어가 너무 빨라서 거의 항상 데이터를 기다리고 있다고 생각합니다. 대기 시간의 문제입니다. 첫 번째가 기다리는 동안 무엇을 요구할지 알아내는 다른 스레드가있을 수도 있습니다.
즉, 당신은 본질적으로 4 개의 실제 코어가 2 Real/2 Hyper보다 빠릅니다. 그것은 단지 2 Real/2 Hyper가 그들 자신의 경우 2 실제보다 빠르며, 다른 모든 것들이 평등합니다.
또한 하이퍼 스레드가 하드웨어를 공유하기 때문에 캐시를 통해 데이터를 공유 할 수 있다고 생각합니다. 그래서 나는 당신이 많은 의사 소통을 가진 두 개의 스레드를 가지고 있다면 한 번 코어에서 더 행복 할 수 있다고 생각합니다. 그것이 실제로 어떻게 작동하는지 잘 모르겠습니다. 그것은 좋은 튜닝과 나쁜 튜닝의 이상한 조합 인 것 같습니다 (이것이 좋은 의사 소통이 좋으면 두 개의 스레드가되어서는 안됩니다?))
편집 : 가이드 라인은 모호하게 쏟아지는 것을 기억하는 것은 실제 코어의 수를 일정하게 유지하고, 하이퍼 스레딩은 약 30%에 좋고 추가 성능을 변경한다는 것입니다. 100%가 아님.
더 많은 옵션
레드 리더
Ars Legatus Legionis
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29436487#P29436487 : KLBS68DB가 말했습니다
Tom Dunkerton [/url] “: klbs68db] 이유는 확실하지 않지만 하이퍼 스레딩이없는 4 개의 코어가 하이퍼 스레딩을 가진 듀얼 코어보다 스레드 당 더 빠를 것이라고 생각합니다. 내가 무엇을 놓치고 있는지?
내 생각에 컴퓨터가 어떻게 작동하는지 이해하지 못할 것입니다. Ars Technica는 약 10 년 전에이 주제에 대한 아주 좋은 기사를 많이 가지고있었습니다. 그들을 파헤칠 가치가있을 수 있습니다.
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29438331#P29438331 : KLBS68DB가 말했습니다
Breze [/url] “: klbs68db]
즉, 당신은 본질적으로 4 개의 실제 코어가 2 Real/2 Hyper보다 빠릅니다. 그것은 단지 2 Real/2 Hyper가 그들 자신의 경우 2 실제보다 빠르며, 다른 모든 것들이 평등합니다.
“2 Real/2hyper”가 아닙니다. 당신은 여전히 정확히 2 개의 코어를 가지고 있습니다. 단지 각각은 한 번에 2 개의 스레드를 실행할 수 있습니다. 그 중 하나는 다른 것보다 “실제”가 아닙니다.
더 많은 옵션
연속체
Ars Legatus Legionis
중재자
우리는 이것에 대한 토론을했는데 도움이 될 수 있습니다?
더 많은 옵션
Tom Dunkerton
ars praefectus
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29439557#P29439557 : 1CD9UD67 말했다 :
continuum [/url] “: 1cd9ud67] 우리는 이것에 대한 논의를했는데 도움이 될 수 있습니다?
더 많은 옵션
브리즈
ars praefectus
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29439055#P29439055 : 172MK6GH는 말했습니다
Redleader [/url] “: 172mk6gh]
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29436487#P29436487 : 172MK6GH는 말했습니다
Tom Dunkerton [/url] “: 172mk6gh] 왜 그런지 잘 모르겠지만, 하이퍼 스레딩이없는 4 개의 코어가 하이퍼 스레딩이있는 듀얼 코어보다 스레드 당 더 빠를 것이라고 생각합니다. 내가 무엇을 놓치고 있는지?
내 생각에 컴퓨터가 어떻게 작동하는지 이해하지 못할 것입니다. Ars Technica는 약 10 년 전에이 주제에 대한 아주 좋은 기사를 많이 가지고있었습니다. 그들을 파헤칠 가치가있을 수 있습니다.
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29438331#P29438331 : 172MK6GH 말했다 :
Breze [/url] “: 172mk6gh]
즉, 당신은 본질적으로 4 개의 실제 코어가 2 Real/2 Hyper보다 빠릅니다. 그것은 단지 2 Real/2 Hyper가 그들 자신의 경우 2 실제보다 빠르며, 다른 모든 것들이 평등합니다.
“2 Real/2hyper”가 아닙니다. 당신은 여전히 정확히 2 개의 코어를 가지고 있습니다. 단지 각각은 한 번에 2 개의 스레드를 실행할 수 있습니다. 그 중 하나는 다른 것보다 “실제”가 아닙니다.
글쎄 그는 4 개의 실제 코어가 일반적으로 하이퍼 스레딩으로 2 개보다 빠르다는 사실은 잘못되지 않습니다 (반면에, 하이퍼 스레딩 시스템에 두 가지 유형의 스레드가 있다는 것을 잘못 암시했습니다)
더 많은 옵션
Jlarja
아르스 센터 리온
내가 읽을 수있는 한, 원래 포스터는 특히 단일 스레드의 처리량이 동일한 코어에서 실행되는 다른 스레드의 영향을 받는지 묻습니다. 물론 그것은 대단합니다! 하이퍼 스레드 싱글 코어 또는 듀얼 코어로 동일한 성능을 얻을 수 있다면 인텔이나 다른 사람이 듀얼 코어 또는 쿼드 코어 프로세서를 만드는 이유?
더 많은 옵션
피팅
Ars Legatus Legionis
가입자++
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29440315#P29440315 : ISM45JMP가 말했습니다
jlarja [/url] “: ism45jmp] 내가 읽을 수있는 한, 원래 포스터는 특히 단일 스레드의 처리량이 동일한 코어에서 실행되는 다른 스레드의 영향을 받는지 묻습니다. 물론 그것은 대단합니다!
그것은 스레드가 무엇을하고 있는지에 달려 있습니다. 동일한 하드웨어 리소스와 경쟁하는 두 개의 스레드 (FPU 무겁기, 메모리 바운드 등.) 그러나 경쟁하지 않는 두 개의 스레드 (한 스레드 FPU가 무겁고 다른 스레드는 실제로 FPU가없고 캐시와 관련하여 상당히 잘 작동)는 경쟁이 크지 않습니다.
이것을 논의하기위한 일반 명명법은 4C/8T (4 개의 코어, 8 개의 스레드), 2C/4T (2 개의 코어, 4 개의 스레드) 등입니다. “2 개의 코어, 2 개의 하이퍼”지정에 대한 코어 당 두 스레드 (또는 그 이상) 사이의 현대 프로세서에는 차이가 없습니다.
더 많은 옵션
BYOSYS
ars praefectus
가입자++
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29441313#P29441313 : 26MIAQLU는 다음과 같이 말했습니다
Fitten [/url] “: 26MIAQLU]
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29440315#P29440315 : 26MIAQLU가 말했습니다
Jlarja [/url] “: 26Miaqlu] 내가 읽을 수있는 한, 원래 포스터는 특히 동일한 코어에서 실행되는 다른 스레드의 처리량이 영향을 받는지 묻습니다. 물론 그것은 대단합니다!
그것은 스레드가 무엇을하고 있는지에 달려 있습니다. 동일한 하드웨어 리소스와 경쟁하는 두 개의 스레드 (FPU 무겁기, 메모리 바운드 등.) 그러나 경쟁하지 않는 두 개의 스레드 (한 스레드 FPU가 무겁고 다른 스레드는 실제로 FPU가없고 캐시와 관련하여 상당히 잘 작동)는 경쟁이 크지 않습니다.
이것을 논의하기위한 일반 명명법은 4C/8T (4 개의 코어, 8 개의 스레드), 2C/4T (2 개의 코어, 4 개의 스레드) 등입니다. “2 개의 코어, 2 개의 하이퍼”지정에 대한 코어 당 두 스레드 (또는 그 이상) 사이의 현대 프로세서에는 차이가 없습니다.
하이퍼 스레딩은 단일 스레드 성능을 도울 수 없지만 오버 헤드는 일반적으로 매우 작습니다. Fitten Secior와 같은 몇 가지 경우 외에, Hyperthreading은 일반적으로 프로세서의 사용하지 않은 부분을 동일한 물리적 코어에서 평행하게 실행하는 데 능숙하여 속도를 높이고 있습니다. 예를 들어, 물리적 코어의 미사용 부분에 두 번째 스레드를 사용하면 스케줄러가 배경 작업을 처리하는 데 관심이있는 작업을 방해 할 수 없습니다.
더 많은 옵션
모자 몬스터
Ars Legatus Legionis
가입자
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29441313#P29441313 : 3JXFYNH2가 말했습니다
Fitten [/url] “: 3jxfynh2]
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29440315#P29440315 : 3JXFYNH2가 말했습니다
jlarja [/url] “: 3jxfynh2] 내가 읽을 수있는 한, 원래 포스터는 특히 단일 스레드의 처리량이 동일한 코어에서 실행되는 다른 스레드의 영향을 받는지 묻습니다. 물론 그것은 대단합니다!
이것을 논의하기위한 일반 명명법은 4C/8T (4 개의 코어, 8 개의 스레드), 2C/4T (2 개의 코어, 4 개의 스레드) 등입니다. “2 개의 코어, 2 개의 하이퍼”지정에 대한 코어 당 두 스레드 (또는 그 이상) 사이의 현대 프로세서에는 차이가 없습니다.
예, 있습니다. CPU는 “실제”및 “논리적”프로세서로 식별됩니다. 각 코어는 물리적 + 논리입니다. OS는 일반적으로 (전력 관리가 개입하지 않는 한) 논리 전에 물리적으로 일정을 잡을 것입니다. Android (Nexus Devices, 멋진 크게.예를 들어, 작은 물건) 예를 들어, 다른 코어가 깨어나 기 전에 특정 하중이 필요하고 특정 최소 시계에 도달해야합니다.
더 많은 옵션
브리즈
ars praefectus
하이퍼 스레딩을 사용하면 기계에는 2 개가 있습니다 (또는 4 [누구든지 본 사람이 있습니까??]) 물리적 코어 당 스레드. 사용 된 스레드 매핑 -> 스레드는 환경에 따라 다릅니다. 워크로드에 따라 별도의 물리적 코어에서 스레드에 작업을 예약하는 것이 합리적 일 수 있습니다. 예를 들어 OpenMP는 그렇지 않지만 강제로.
OS가 스레드 중 일부가 특별한 것보다 자의적으로 구별되는 것 같습니다. 코어 당 하나의 스레드를 ‘Extra.’그런 식으로 프로그래머는 실제로 “실제 스레드에서 작업 일정 시작”이라고 말할 수 있습니다.”
더 많은 옵션
레드 리더
Ars Legatus Legionis
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29443099#P29443099 : 2856VWWW는 말했다 :
Breze [/url] “: 2856vwww] 하이퍼 스레딩이있는 기계에는 2 개가 있습니다 (또는 4 [누구든지 3 개가있는 사람이 있습니까??])))
물론, Qualcomm 육각형은 3 방향 SMT입니다.
더 많은 옵션
레드 리더
Ars Legatus Legionis
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29442833#P29442833 : Zynp60yg는 다음과 같습니다
모자 몬스터 [/url] “: zynp60yg]
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29441313#P29441313 : Zynp60yg는 다음과 같습니다
Fitten [/url] “: zynp60yg]
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29440315#P29440315 : Zynp60yg는 다음과 같습니다
Jlarja [/url] “: zynp60yg] 내가 읽을 수있는 한, 원래 포스터는 특히 동일한 코어에서 실행되는 다른 스레드의 처리량에 영향을 미치는지 묻습니다. 물론 그것은 대단합니다!
이것을 논의하기위한 일반 명명법은 4C/8T (4 개의 코어, 8 개의 스레드), 2C/4T (2 개의 코어, 4 개의 스레드) 등입니다. “2 개의 코어, 2 개의 하이퍼”지정에 대한 코어 당 두 스레드 (또는 그 이상) 사이의 현대 프로세서에는 차이가 없습니다.
예, 있습니다. CPU는 “실제”및 “논리적”프로세서로 식별됩니다. 각 코어는 물리적 + 논리입니다.
내가 아는 한, 그것은 OS가 스레드를 올바르게 할당하는 데 도움이되는 조직의 일입니다. 어느 것이 “물리적”인 선택은 임의적입니다.
더 많은 옵션
netmasteroc3
ars praefectus
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29442833#P29442833 : 3RSJ3EOD가 말했습니다
모자 몬스터 [/url] “: 3RSJ3EOD]
예, 있습니다. CPU는 “실제”및 “논리적”프로세서로 식별됩니다. 각 코어는 물리적 + 논리입니다.
ER, 그것은 Intel CPU가 정보를 제시하는 방식이 아닙니다. 모든 스레드는 논리적이며 물리적 스레드 나 논리 스레드의 개념은 없습니다. 코어는 1 개 이상 (Xeon Phis의 경우 2, 4) 스레드를 실행할 수 있습니다. 그것이 시스템에 대한 가시성의 정도입니다. 내부적으로 프론트 엔드 디코딩/디스패치/스케줄 하드웨어는 특별한 케이싱이 아닙니다. 필요하지도 않아도됩니다. 단순히 N- 스레드를 허용 한 한계까지 추적합니다.
CPUID 정보는이 논리적 스레드를 물리적 핵심의 어린이 개념으로 반영합니다. OS는 어떤 CPU에서 실행중인 스레드를 추적 할 수 있지만, 코어의 스케줄러 또는 그 이후의 실행 장치에는 가시성이 없습니다.
더 많은 옵션
모자 몬스터
Ars Legatus Legionis
가입자
나는 “물리적 실”또는 “논리 스레드”에 대해 아무 말도하지 않았다. 나는 CPU 코어가 OS에 물리적 및 논리적 프로세서로서 자신을 제시한다고 말했다. 이것은 OS 스케줄러가 전원을 저장하는 데 도움이됩니다 (SMTING 코어가 다른 스레드를 취할 수있는 경우 다른 코어를 깨우지 마십시오) 또는 더 잘 수행합니다 (하나 대신 두 코어 사용).
스레드가 관리하는 한, 그들은 단지 “실행 중”. CPU 디스패처가 결정할 때와 같이 자원을 얻는다.
더 많은 옵션
netmasteroc3
ars praefectus
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29446355#P29446355 : 7E0SH86S가 말했습니다
모자 몬스터 [/url] “: 7E0SH86S]
나는 CPU 코어가 OS에 물리적 및 논리적 프로세서로서 자신을 제시한다고 말했다. 나는 CPU 코어가 OS에 물리적 및 논리적 프로세서로서 자신을 제시한다고 말했다.
우리가 서로 과거에 이야기하는지 아닌지 잘 모르겠습니다. 당신의 nitpick.
내가 말하는 것은 적어도 인텔에게는 물리적 공장 관계가 계층 적이며 하드웨어가 당신의 방식을 구별하거나 차별화하지 않는다는 것입니다. 물리적 프로세서는 핵심입니다. 각 코어에는 하나 이상의 논리적 프로세서가 포함됩니다. 이것은 내가 가지고있는 CPUID 데이터에서 알 수있는 한 적어도 P4로 거슬러 올라가는 경우입니다.
당신이 그리는 구별은 현실과 일치하지 않습니다. 적어도 나 (그리고 redleader로 보이는 것처럼 보이는 것)는 그것을 해석합니다.
하드웨어 관점에서 논리적 프로세서는 파일 및 지침을 등록하는 트랙을 추적하는 논리의 태그입니다. 소프트웨어 관점에서 물리적 프로세서는 논리적 프로세서와 캐시를 그룹화하는 컨테이너 일 뿐이므로 OS는 실리콘의 물리적 배열에 대해 알고 있습니다.
더 많은 옵션
피팅
Ars Legatus Legionis
가입자++
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29446355#P29446355 : MRITO0BP가 말했습니다
Hat Monster [/url] “: mrito0bp]는 다른 사람보다 우선 순위를 갖지 않으며 CPU 디스패처가 결정할 때 자원을 얻습니다.
그것이 내가 말한 것입니다
더 많은 옵션
Jimbopalmer
Ars Tribunus angusticlavius
가입자
나는 OP가 요청한 것에 대해 또 다른 관점을 취할 것입니다.
매우 초기 하이퍼 스레딩에서는 꺼져있는 것보다 동일한 작업보다 느린 워크로드가있었습니다.
이것은 몇 년 동안 사실이 아닙니다.
단일 작업이 있으면 HyperThreading이 켜져있는 것처럼 빠르게 실행됩니다.
예를 들어, 두 개의 코어가있는 CPU와 4 개의 스레드가있는 경우 동일한 클럭 속도에서 단일 코어, 단일 스레드 CPU만큼 단일 스레드를 실행합니다. 두 번째 스레드를 시작하면 두 번째 코어에 할당 될 가능성이 높으며 메모리 병목 현상을 막으면 동일한 클럭 속도에서 두 개의 PC를 사용하는 것과 동일한 속도로 실행됩니다. 처리량이 100% 증가
세 번째 스레드를 시작하면 (세 번째 스레드가 아님!) 하나의 코어는 하이퍼 스레딩을 시작하여 일반적으로 처리량이 30%만 더 향상되므로 각 코어는 평균 35%둔화됩니다. (다시 말하지만, 이것은 작업량에 따라 다르고, 다른 알고리즘은 이미 자원을 기다리고있을 수 있습니다. 일부 알고리즘은 메모리에 묶여 두 개의 스레드를 실행하는 두 개의 코어가 충돌 할 수 있습니다)
네 개의 스레드가 모두 사용되면 약 2.단일 스레드의 처리량의 6 배이므로 동일한 시스템에서 실행되는 단일 스레드와 비교하여 65%가 빠른 것보다 빠르게 65% 일 수 있습니다. 그러나 hyerthreading으로 인해 무너지지 않았습니다. 컴퓨터가 4 개의 Separte 작업을하도록 요청했기 때문에 속도가 느려졌습니다. 단일 코어 싱글 스레드 CPU에 4 개의 컴퓨팅 바운드 작업을 수행하도록 요청하면 단일 작업만큼 빠른 25%에 불과합니다.
하이퍼 스레딩은 제조업체가 코어를 추가 할 공간이 부족할 때마다 승리입니다. 미래에는 더 작은 다이와 더 미세한 해상도로 더 많은 코어와 하이퍼 스레딩이 점점 더 흔해질 것입니다. 트랜지스터를 사용하는 거의 유일한 다른 것은 더 크고 큰 캐시이며, 이는 작업량이 충돌하지 않는 데 도움이됩니다.
더 많은 옵션
Jlarja
아르스 센터 리온
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29441313#P29441313 : JVVFTVYO가 말했습니다
Fitten [/url] “: JVVFTVYO]
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29440315#P29440315 : JVVFTVYO가 말했습니다
jlarja [/url] “: jvvftvyo] 내가 읽을 수있는 한, 원래 포스터는 특히 단일 스레드의 처리량이 동일한 코어에서 실행되는 다른 스레드의 영향을 받는지 묻습니다. 물론 그것은 대단합니다!
그것은 스레드가 무엇을하고 있는지에 달려 있습니다. 동일한 하드웨어 리소스와 경쟁하는 두 개의 스레드 (FPU 무겁기, 메모리 바운드 등.) 그러나 경쟁하지 않는 두 개의 스레드 (한 스레드 FPU가 무겁고 다른 스레드는 실제로 FPU가없고 캐시와 관련하여 상당히 잘 작동)는 경쟁이 크지 않습니다.
이것을 논의하기위한 일반 명명법은 4C/8T (4 개의 코어, 8 개의 스레드), 2C/4T (2 개의 코어, 4 개의 스레드) 등입니다. “2 개의 코어, 2 개의 하이퍼”지정에 대한 코어 당 두 스레드 (또는 그 이상) 사이의 현대 프로세서에는 차이가 없습니다.
그것은 좋은 이론이지만 (그리고 마케팅 슬라이드에서 훌륭한 다이어그램을 만듭니다), 나는 그것이 어딘가에 테스트 된 것을보고 싶습니다. 마지막으로 리뷰 사이트 테스트를 보았을 때 이것은 P4 시대에 있었는데, 하이퍼 스레딩이 새로운 것이 었습니다. 그들은 P4의 아키텍처를 고려할 때 잘 작동하는 워크로드를 실제로 찾을 수 없었습니다.
이것이 최근에 테스트되었는지 아는 사람이 있습니까?? 특히 Haswell은 이러한 테스트에서 잘 지낼 수있는 것처럼 보이지만 이미 많은 정수에서는 이미 잘 작동합니다.
그건 그렇고, 나는 하이퍼 스레딩을 좋아합니다. 큰 C (++) 코드베이스를 컴파일하는 데 좋습니다. 이것이 제가 직장에서 항상하는 일입니다. 하지만 두 번의 코어 수가 더 좋을 것이라는 데는 의문의 여지가 없습니다.
더 많은 옵션
피팅
Ars Legatus Legionis
가입자++
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29450801#P29450801 : 1CF23TGA가 말했다 :
jlarja [/url] “: 1CF23TGA]
이것이 최근에 테스트되었는지 아는 사람이 있습니까??
수년에 걸쳐 많은 테스트를 받았습니다 (Google을 검색하여 쉽게 찾을 수 있음). 결과는 워크로드 및 알고리즘에 따라 다릅니다. 위에서 언급 한 바와 같이, 동일한 자원에 대해 경쟁하는 스레드는 여러 가지 다른 행동을 보일 수 있지만 다른 시나리오는 호의적으로 재생됩니다 (HT에 유리한 테스트에서 최대 20% 더 빠른 전체 프로세스 실행 시간). HT가 상당한 둔화 (심각한 자원 경쟁)를 가질 수있는 특별한 경우가 있지만 대부분의 경우 둔화는 테스트의 오류 마진 내에있는 것 같습니다. 항상 그렇듯이 전반적인 성능에 대한 HT의 영향과 활성화 가치가 있는지 여부를 결정하기 위해 수행 할 작업과 유사한 테스트를 찾는 것이 중요합니다.
더 많은 옵션
레드 리더
Ars Legatus Legionis
Haswell에서 백엔드는 훨씬 더 넓고 (7 포트), 그중 더 많은 정수 작업을 수행 할 수 있으므로 실행 포트에 대한 경합이 적기 때문에 스케일링이 약간 다를 수 있습니다
로드/스토어 용 4 포트, 정수 용 4 개 포트, 지점에는 2 개, 동일한 정수 작업을 실행하는 2 개의 스레드조차도 많은 경합을 소개하지 않을 것입니다.
더 많은 옵션
Jlarja
아르스 센터 리온
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29453201#P29453201 : 1G7FY5RL이 말했습니다
Fitten [/url] “: 1G7FY5RL]
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29450801#P29450801 : 1G7FY5RL이 말했습니다
jlarja [/url] “: 1g7fy5rl]
이것이 최근에 테스트되었는지 아는 사람이 있습니까??
수년에 걸쳐 많은 테스트를 받았습니다 (Google을 검색하여 쉽게 찾을 수 있음). 결과는 워크로드 및 알고리즘에 따라 다릅니다. 위에서 언급 한 바와 같이, 동일한 자원에 대해 경쟁하는 스레드는 여러 가지 다른 행동을 보일 수 있지만 다른 시나리오는 호의적으로 재생됩니다 (HT에 유리한 테스트에서 최대 20% 더 빠른 전체 프로세스 실행 시간). HT가 상당한 둔화 (심각한 자원 경쟁)를 가질 수있는 특별한 경우가 있지만 대부분의 경우 둔화는 테스트의 오류 마진 내에있는 것 같습니다. 항상 그렇듯이 전반적인 성능에 대한 HT의 영향과 활성화 가치가 있는지 여부를 결정하기 위해 수행 할 작업과 유사한 테스트를 찾는 것이 중요합니다.
하이퍼 스레딩의 유무에 관계없이 작업량을 실행한다는 의미는 아닙니다. 그것은 항상 테스트되고 있습니다 (Core i5 vs i7). 나는 두 개의 다른 워크로드 (Raytracing과 같은 플로팅 포인트 및 평행 한 C ++ 컴파일과 같은 정수 무겁음)를 실행하는 것을 의미했습니다.
위의 답변에서 (20 % 더 빠른 전체 프로세스) 나는 우리가 여전히 다른 것에 대해 이야기하고 있음을 알았습니다. 때로는 전체 진행 상황에 관심이 없지만 단일 작업에 대해 (하나 이상의 스레드 일 수 있습니다. 전체 프로세서를 제거 할 수없는 한 실제로 중요하지 않습니다).
하이퍼 스레딩 전에 배경에서 배포 된 컴퓨팅 프로젝트를 항상 실행할 수 있습니다. 그들은 유휴 상태로 실행되었으므로 속도를 늦추지 않았습니다. 요즘에는 작동하지 않습니다. 하이퍼 스레드 코어에 다른 물건과 함께 DC 스레드가 실행되므로 다른 것들이 속도가 느려집니다.
실생활의 또 다른 예 : MythTV 기반 DVR에서 4C/8T I7 4771에서 하나의 스레드 만 사용하도록 배경 상업 감지를 제한해야했습니다. 어쩌면 코딩 한 사람은 하이퍼 스레딩을 신뢰하지 않을 수도 있습니다. 8 개의 스레드를 모두 사용했다면 문제가 없습니다). 상업적 탐지가 높은 좋은 값으로 실행되는 데 도움이되지 않으며, TV에서 이미지를 부드럽게 가져 오는 더 중요한 전경 작업에서 여전히 시간을 훔칩니다.
나는 이것이 원래 포스터가 묻는 일종의 상황이라고 생각합니다. 이 상황에서, 하이퍼 스레딩은 스레딩이 아닌 사례에서하지 않는 방식으로 물건을 느리게합니다. 당신은 멍청하거나 OS가 멍청하다고 사용자를 비난하고 모든 것이 설계된대로 작동한다고 말할 수 있습니다. 나는 동의하지도 않습니다. 나는 단지 원래 질문에 대답하려고 노력하고 있습니다 .
더 많은 옵션
netmasteroc3
ars praefectus
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29457345#P29457345 : TCEZXJMB가 말했습니다
jlarja [/url] “: tcezxjmb]
실생활의 또 다른 예 : MythTV 기반 DVR에서 4C/8T I7 4771에서 하나의 스레드 만 사용하도록 배경 상업 감지를 제한해야했습니다.
내 마음에 더 큰 질문은 4 개의 스레드를 취하는 이유와 HD 컨텐츠를 재생하는 데 많은 시간이 걸리는 이유입니다.
1080 h의 재생.264와 h.265 컨텐츠는 그렇게 까다 롭지 않으며 CPU를 처리 할 수있는 많은 CPU가 있습니다. 또는 다른 방법으로, 내 컴퓨터에서 1080p 컨텐츠의 재생은 내 CPU 시간 (i5-2500K)의 10% 만 섭취하고 실시간보다 1080p 컨텐츠를 인코딩 할 수 있으며 동시에 1080p 컨텐츠를 시청할 수 있으며 재생은 여전히 매끄럽게 유지되며 인코딩은 여전히 남아 있어야합니다. MBP의 I7-4980HQ 에서이 케이스는 본질적으로 동일합니다.
더 많은 옵션
Jlarja
아르스 센터 리온
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29457527#P29457527 : CKO73P2V가 말했습니다
netmasteroc3 [/url] “: cko73p2v]
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29457345#P29457345 : CKO73P2V가 말했습니다
jlarja [/url] “: cko73p2v]
실생활의 또 다른 예 : MythTV 기반 DVR에서 4C/8T I7 4771에서 하나의 스레드 만 사용하도록 배경 상업 감지를 제한해야했습니다.
내 마음에 더 큰 질문은 4 개의 스레드를 취하는 이유와 HD 컨텐츠를 재생하는 데 많은 시간이 걸리는 이유입니다.
1080 h의 재생.264와 h.265 컨텐츠는 그렇게 까다 롭지 않으며 CPU를 처리 할 수있는 많은 CPU가 있습니다. 또는 다른 방법으로, 내 컴퓨터에서 1080p 컨텐츠의 재생은 내 CPU 시간 (i5-2500K)의 10% 만 섭취하고 실시간보다 1080p 컨텐츠를 인코딩 할 수 있으며 동시에 1080p 컨텐츠를 시청할 수 있으며 재생은 여전히 매끄럽게 유지되며 인코딩은 여전히 남아 있어야합니다. MBP의 I7-4980HQ 에서이 케이스는 본질적으로 동일합니다.
가장 최적의 방법을 사용하지 않습니다 (분명히 깨진 H를 처리 할 수 없기 때문에.264 매번 케이블 TV 커넥터에서 나오는 것은 다른 처리도 수행합니다 (De-Interacing은 아마도 가장 까다로운 단계 일 것입니다). 하드웨어 가속 없음 ( “가장 최적의 방법을 사용하지 않음”의 일부). 또한 비트 전송률은 스트림 가능 또는 다운로드 가능한 콘텐츠에서 볼 수있는 것보다 종종 높습니다 (4-5GBS / 시간은 상당히 정상입니다).
편집 : 일반적으로 부하는 완전히 사용 된 두 개의 스레드 주위에 있습니다. 네 스레드 케이스는 자주 귀찮을 정도로 충분합니다. 특히 프레임을 건너 뛰거나 말더듬을 건너 뛰지 않기 때문에 종종 재생이 끝납니다 (아마도 MythTV는 녹음이 끝났다고 생각합니다.
VLC로 동일한 파일을 재생하면 VLC가 재생을 거부하는 경우를 제외하고는 훨씬 더 잘 작동합니다. 요즘 TV를 보는 것은 엄청나게 어렵습니다.
더 많은 옵션
피팅
Ars Legatus Legionis
가입자++
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29457345#P29457345 : 2MVY04FA가 말했습니다
jlarja [/url] “: 2mvy04fa]
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29453201#P29453201 : 2MVY04FA가 말했습니다
Fitten [/url] “: 2MVY04FA]
[url = http : // arstechnica.com/civis/viewtopic.PHP?P = 29450801#P29450801 : 2MVY04FA가 말했습니다
jlarja [/url] “: 2mvy04fa]
이것이 최근에 테스트되었는지 아는 사람이 있습니까??
수년에 걸쳐 많은 테스트를 받았습니다 (Google을 검색하여 쉽게 찾을 수 있음). 결과는 워크로드 및 알고리즘에 따라 다릅니다. 위에서 언급 한 바와 같이, 동일한 자원에 대해 경쟁하는 스레드는 여러 가지 다른 행동을 보일 수 있지만 다른 시나리오는 호의적으로 재생됩니다 (HT에 유리한 테스트에서 최대 20% 더 빠른 전체 프로세스 실행 시간). HT가 상당한 둔화 (심각한 자원 경쟁)를 가질 수있는 특별한 경우가 있지만 대부분의 경우 둔화는 테스트의 오류 마진 내에있는 것 같습니다. 항상 그렇듯이 전반적인 성능에 대한 HT의 영향과 활성화 가치가 있는지 여부를 결정하기 위해 수행 할 작업과 유사한 테스트를 찾는 것이 중요합니다.
하이퍼 스레딩의 유무에 관계없이 작업량을 실행한다는 의미는 아닙니다. 그것은 항상 테스트되고 있습니다 (Core i5 vs i7). 나는 두 개의 다른 워크로드 (Raytracing과 같은 플로팅 포인트 및 평행 한 C ++ 컴파일과 같은 정수 무겁음)를 실행하는 것을 의미했습니다.
위의 답변에서 (20 % 더 빠른 전체 프로세스) 나는 우리가 여전히 다른 것에 대해 이야기하고 있음을 알았습니다. 때로는 전체 진행 상황에 관심이 없지만 단일 작업에 대해 (하나 이상의 스레드 일 수 있습니다. 전체 프로세서를 제거 할 수없는 한 실제로 중요하지 않습니다).
하이퍼 스레딩 전에 배경에서 배포 된 컴퓨팅 프로젝트를 항상 실행할 수 있습니다. 그들은 유휴 상태로 실행되었으므로 속도를 늦추지 않았습니다. 요즘에는 작동하지 않습니다. 하이퍼 스레드 코어에 다른 물건과 함께 DC 스레드가 실행되므로 다른 것들이 속도가 느려집니다.
실생활의 또 다른 예 : MythTV 기반 DVR에서 4C/8T I7 4771에서 하나의 스레드 만 사용하도록 배경 상업 감지를 제한해야했습니다. 어쩌면 코딩 한 사람은 하이퍼 스레딩을 신뢰하지 않을 수도 있습니다. 8 개의 스레드를 모두 사용했다면 문제가 없습니다). 상업적 탐지가 높은 좋은 값으로 실행되는 데 도움이되지 않으며, TV에서 이미지를 부드럽게 가져 오는 더 중요한 전경 작업에서 여전히 시간을 훔칩니다.
나는 이것이 원래 포스터가 묻는 일종의 상황이라고 생각합니다. 이 상황에서, 하이퍼 스레딩은 스레딩이 아닌 사례에서하지 않는 방식으로 물건을 느리게합니다. 당신은 멍청하거나 OS가 멍청하다고 사용자를 비난하고 모든 것이 설계된대로 작동한다고 말할 수 있습니다. 나는 동의하지도 않습니다. 나는 단지 원래 질문에 대답하려고 노력하고 있습니다 .
나는 실제로 다른 메시지에서 이것에 대해 조금 입력했지만 삭제했습니다. Stokes는 여기에 읽기/시계에 좋은 AR에 대한 HT 프레젠테이션이 있습니다. 그러나 가장 간단한 설명에서, 두 HT 명령 스트림의 지침은 프로세서 유휴 리소스의 ‘갭’을 작성하기 위해 발행됩니다. 두 스트림의 일부 지침에는 동시에 동일한 리소스가 필요합니다. 그런 일이 발생하면 그 경합은 반드시 해당 지침에 대해 직렬화 될 것입니다. 완벽한 세상 (또는 충분한 자원이있는)에서는 동시에 발행 될 수 있으며 영향을 미치지 않을 것입니다. 그러나 각 코어가 단순히 필요한 자원의 2 배를 가졌다면 효과적으로 두 개의 분리 된 물리적 코어가 될 것이므로 두 개의 별도 코어를 만들지 마십시오?
단일 코어 (단일 스레드 코어)에서 간단한 시간 슬라이싱의 옛날에 대해 생각하십시오. 예를 들어 스레드가 IO를 기다리면 OS는 해당 스레드를 선점하고 다른 스레드를 예약 할 수 있습니다. 이 모든 것은 OS 수준에있었습니다. 그러나 OS는 캐시 레벨에서 실제로 볼 수 없었으며, 예를 들어 시간 슬라이싱에서 다른 작업을 예약하기위한 오버 헤드는 캐시 미스에 비해 크기 때문에 원치 않을 수도 있습니다. 이제 우리는 하드웨어에있는 SMT/HT를 보유하고 있습니다. 하드웨어 및 * 할 수 있습니다 * 짝수 캐시 미스 및 실행 위험 스톨 (단일 숫자 클록 사이클)의 수준에서 볼 수 있으며 유휴 코어 하드웨어 리소스를 활용하기 위해 여러 하드웨어 스레드/컨텍스트에서 지침을 발행 할 수 있습니다.
그래서 이것을 확장하십시오 (이상화 된 단순화 된 예제 세트. 모든 핵심 리소스가 동일하다고 가정합니다. 모든 정수 유형 자원과 마찬가지로 부동 소수점을 무시하십시오). 스톨 (데이터 또는 기타)이 없기 때문에 작동하는 두 개의 동일한 스레드가있는 경우 코어에는 하나의 스레드를 사용할 수있는 것보다 추가 리소스가 없습니다 (현재 HT 프로세서의 경우에는 그렇지 않습니다. 그들은 더 많은 것을 가지고 있습니다. 그런 다음 스레드는 완벽하게 공정한 스케줄링 (한 스트림에서 하나의 지시를 받고 다른 하나에서 하나의 지시를 받고 다른 하나에서 반복)을 가정 할 때 각각 가설 적으로 2 배의 길이로 2 배를 가져갑니다. 카드의 최종 결과 데크는 원래 데크 중 하나의 높이 2 배입니다. 이제 결과 데크에 카드 수가 2 배가 있기 때문입니다 (WallClock 실행 시간과 비교할 수 있음).
이제 더 많은 마구간이 발생할수록 (또는 더 많은 자원이. 또는 둘 다) 첫 번째 스레드의 실행에 영향을 미치지 않고 다른 스레드가 실행될 수있는 한 스레드에 대해 리소스가 유휴 상태가 될 수 있음을 의미합니다. 그런 다음 두 번째 스레드의 실행이 첫 번째 스레드가 발생했던 것의 엔드 투 엔드 실행 시간에 한 두 번째 스레드가 존재하지 않았을 때까지 첫 번째 스레드의 실행에 영향을 미치지 않는 상황에 빠질 수 있습니다. 스레드는 다른 HT 스레드 실행 유무에 관계없이 동일한 WallClock 실행 시간을 경험했을 것입니다. 이 두 번째 시나리오는 두 개의 물리적 코어를 갖는 것과 동일합니다. 각 시나리는 각각 하나의 컨텍스트 (오늘날 멀티 코어, 비 HT 프로세서에서와 같이) 또는 하나의 스레드가 사용할 수있는 핵심 리소스의 두 배나 1C/2T 코어 만있는 것과 같은 두 개의 물리적 코어를 갖는 것과 동일합니다.
따라서 현실은 그 사이에 있지만 우리는 최고의 케이스 월 클록 실행 시간 페널티가 0%이고 최악의 경우 100%입니다. 단일 스레드의 WallClock 실행에서 경험할 수있는 것은 핵심 리소스와 두 스레드의 명령 스트림에 크게 의존합니다. HT 프로세서는 단일 스레드가 사용할 수있는 리소스의 양의 2 배를 가지지 않습니다. 명령 스트림에는 완벽한 리소스 요구/스톨/캐시 미스 세트가 없으므로 여러 명령 스트림은 다른 스레드가 다른 스레드에 영향을 미치지 않도록 인터리브 될 수 있습니다. 반면에 HT 프로세서는 여러 실행 스레드의 처리량을 개선하기 위해 OS 수준에서 보이지 않고 어쨌든 (시간 슬라이싱)를 활용하기에는 너무 많은 비용이 드는 프로세서에서 “대기”의 세분성을 활용할 수 있습니다. 주어진 스레드는 WallClock 실행 시간이 길어질 수 있지만 전체 작업 (모두/모든 스레드가 함께)은 HT가없는 것보다 더 짧은 월경 실행 시간을 경험할 수 있습니다. 이 질문의 워크로드 특성에 크게 의존한다는 점을 감안할 때, 나는 단일 스레드 월 클록 속도의 숫자를 추측하려고 시도하고 “평균”사례를 구성하려고 시도합니다.
하지만. 단일 스레드의 WallClock 실행 시간에 관심이 있다면 HT를 비활성화하거나 없을 것입니다. 전체 시스템 성능에 대해 우려하는 경우 작업의 WallClock 실행 시간 또는 여러 동시 작업이 가능하면 HT를 활성화 할 수 있습니다. 예를 들어 VM이 ht에서 꽤 잘 혜택을 받는다는 개인적인 경험을 알고 있습니다. 또한 HT 환경에서 HT 컨텍스트만큼 많은 스레드를 산란하는 여러 응용 프로그램을 작성했습니다. 동일한 시스템의 물리적 코어로 스레드 수만 예약하는 것과 비교하여 처리량 증가가 증가합니다. 그러나 HPC 세계에서 “무거운”FPU 코드조차도 실제로 FPU가 덜 무거운 경향이 있다는 것을 알고 있습니다 (일부 해결 코드에서 명령 스트림 FPU 명령의 40%. 나머지 정수 지침). 그러나 이러한 코드에서 캐시 활용은 큰 요소가 될 것입니다 (HT와 스레드를 공유 할 때 캐시를 효과적으로 절반으로 줄이고 메인 메모리에 대한 캐시 미스를 메인 메모리에 더 중요한 요소가 될 수 있습니다 (캐시 크기 적응 형 알고리즘이 도움이 될 수 있습니다).