Copyright 2020 The TensorFlow Authors.
텐서 소개
텐서는 일관된 유형(dtype
이라고 불림)을 가진 다차원 배열입니다. 지원되는 모든 dtypes
은 tf.dtypes.DType
에서 볼 수 있습니다.
NumPy{:.external}에 익숙하다면 텐서가 (일종의) np.arrays
와 유사하다는 것을 참고해 주시기 바랍니다.
모든 텐서는 Python 숫자 및 문자열과 같이 변경할 수 없습니다. 텐서의 내용을 업데이트할 수 없으며 새로운 텐서를 만들 수만 있습니다.
기초
먼저, 기본 텐서를 생성해 봅니다.
다음은 "스칼라" 또는 "순위-0" 텐서입니다. 스칼라는 단일 값을 포함하며 "축"은 없습니다.
"벡터" 또는 "순위-1" 텐서는 값의 목록과 같습니다. 벡터에는 하나의 축이 있습니다.
"행렬" 또는 "순위-2" 텐서에는 두 개의 축이 있습니다.
스칼라, 형상: [] |
벡터, 형상: [3] |
행렬, 형상: [3, 2] |
---|---|---|
![]() |


텐서에는 더 많은 축이 있을 수 있습니다. 여기에는 세 개의 축이 있는 텐서가 사용됩니다.
축이 두 개 이상인 텐서를 시각화하는 방법에는 여러 가지가 있습니다.
3축 텐서, 형상: [3, 2, 5] |
|
---|---|
![]() |
![]() |

np.array
또는 tensor.numpy
메서드를 사용하여 텐서를 NumPy 배열로 변환할 수 있습니다.
텐서에는 종종 float와 int가 포함되지만, 다음과 같은 다른 유형도 있습니다.
복소수
문자열
기본 tf.Tensor
클래스에서는 텐서가 "직사각형"이어야 합니다. 즉, 각 축을 따라 모든 요소의 크기가 같습니다. 그러나 다양한 형상을 처리할 수 있는 특수 유형의 텐서가 있습니다.
비정형 텐서(아래의 RaggedTensor 참조)
희소 텐서(아래의 SparseTensor 참조)
덧셈, 요소별 곱셈 및 행렬 곱셈을 포함하여 텐서에 대한 기본 산술을 수행할 수 있습니다.
텐서는 모든 종류의 연산(ops)에 사용합니다.
참고: 일반적으로 TensorFlow 함수가 Tensor
를 입력으로 받을 것을 예상하는 경우 이 함수는 tf.convert_to_tensor
를 사용하여 Tensor
로 변환할 수 있는 모든 항목을 허용하게 됩니다.
형상 정보
텐서는 형상이 있습니다. 사용되는 일부 용어는 다음과 같습니다.
형상: 텐서의 각 차원의 길이(요소의 수)
순위: 텐서 축의 수입니다. 스칼라는 순위가 0이고 벡터의 순위는 1이며 행렬의 순위는 2입니다.
축 또는 차원: 텐서의 특정 차원
크기: 텐서의 총 항목 수, 형상 벡터 요소의 곱
참고: "2차원 텐서"에 대한 참조가 있을 수 있지만, 순위-2 텐서는 일반적으로 2D 공간을 설명하지 않습니다.
텐서 및 tf.TensorShape
객체에는 다음에 액세스하기 위한 편리한 속성이 있습니다.
순위-4 텐서, 형상: [3, 2, 4, 5] |
|
---|---|
![]() |
![]() |
하지만 Tensor.ndim
및 Tensor.shape
속성은 Tensor
객체를 반환하지 않음에 유의해야 합니다. Tensor
가 필요한 경우 tf.rank
또는 tf.shape
함수를 사용해야 합니다. 이 둘의 차이는 미묘하지만 그래프를 작성할 때 중요할 수 있습니다(나중에).
축은 종종 인덱스로 참조하지만, 항상 각 축의 의미를 추적해야 합니다. 축이 전역에서 로컬로 정렬되는 경우가 종종 있습니다. 배치 축이 먼저 오고 그 다음에 공간 차원과 각 위치의 특성이 마지막에 옵니다. 이러한 방식으로 특성 벡터는 연속적인 메모리 영역입니다.
일반적인 축 순서 |
---|
![]() |
인덱싱
단일 축 인덱싱
TensorFlow는 Python의 목록 또는 문자열 인덱싱{:.external}과 마찬가지로 표준 Python 인덱싱 규칙과 NumPy 인덱싱의 기본 규칙을 따릅니다.
인덱스는
0
에서 시작합니다.음수 인덱스는 끝에서부터 거꾸로 계산합니다.
콜론,
:
은start:stop:step
슬라이스에 사용됩니다.
스칼라를 사용하여 인덱싱하면 축이 제거됩니다.
:
슬라이스를 사용하여 인덱싱하면 축이 유지됩니다.
다축 인덱싱
더 높은 순위의 텐서는 여러 인덱스를 전달하여 인덱싱됩니다.
단일 축의 경우에서와 정확히 같은 규칙이 각 축에 독립적으로 적용됩니다.
각 인덱스에 정수를 전달하면 결과는 스칼라입니다.
정수와 슬라이스의 조합을 사용하여 인덱싱할 수 있습니다.
다음은 3축 텐서의 예입니다.
배치에서 각 예의 모든 위치에서 마지막 특성 선택하기 | |
---|---|
![]() |
![]() |
텐서 슬라이싱 가이드에서 인덱싱을 적용하여 텐서의 개별 요소를 조작하는 방법을 알아보세요.
형상 조작하기
텐서의 형상을 바꾸는 것은 매우 유용합니다.
텐서를 새로운 형상으로 바꿀 수 있습니다. 기본 데이터를 복제할 필요가 없으므로 tf.reshape
연산은 빠르고 저렴합니다.
데이터의 레이아웃은 메모리에서 유지되고 요청된 형상이 같은 데이터를 가리키는 새 텐서가 작성됩니다. TensorFlow는 C 스타일 "행 중심" 메모리 순서를 사용합니다. 여기에서 가장 오른쪽에 있는 인덱스를 증가시키면 메모리의 단일 단계에 해당합니다.
텐서를 평평하게 하면 어떤 순서로 메모리에 배치되어 있는지 확인할 수 있습니다.
일반적으로, tf.reshape
의 합리적인 용도는 인접한 축을 결합하거나 분할하는 것뿐입니다(또는 1
을 추가/제거).
이 3x2x5 텐서의 경우, 슬라이스가 혼합되지 않으므로 (3x2)x5 또는 3x (2x5)로 재구성하는 것이 합리적입니다.
몇 가지 좋은 재구성 | ||
---|---|---|
![]() |
![]() |
![]() |
형상을 변경하면 같은 총 요소 수를 가진 새로운 형상에 대해 "작동"하지만, 축의 순서를 고려하지 않으면 별로 쓸모가 없습니다.
tf.reshape
에서 축 교환이 작동하지 않으면, tf.transpose
를 수행해야 합니다.
몇 가지 안 좋은 재구성 | ||
---|---|---|
![]() |
![]() |
![]() |
완전히 지정되지 않은 형상 전체에 걸쳐 실행할 수 있습니다. 형상에 None
(축 길이를 알 수 없음)이 포함되거나 전체 형상이 None
(텐서의 순위를 알 수 없음)입니다.
tf.RaggedTensor를 제외하고 이러한 형상은 TensorFlow의 상징적인 그래프 빌딩 API 컨텍스트에서만 발생합니다.
DTypes
에 대한 추가 정보
tf.Tensor
의 데이터 유형을 검사하려면, Tensor.dtype
속성을 사용합니다.
Python 객체에서 tf.Tensor
를 만들 때 선택적으로 데이터 유형을 지정할 수 있습니다.
그렇지 않으면, TensorFlow는 데이터를 나타낼 수 있는 데이터 유형을 선택합니다. TensorFlow는 Python 정수를 tf.int32
로, Python 부동 소수점 숫자를 tf.float32
로 변환합니다. 그렇지 않으면, TensorFlow는 NumPy가 배열로 변환할 때 사용하는 것과 같은 규칙을 사용합니다.
유형별로 캐스팅할 수 있습니다.
브로드캐스팅
브로드캐스팅은 NumPy의 해당 특성{:.external}에서 빌린 개념입니다. 요컨대, 특정 조건에서 작은 텐서는 결합된 연산을 실행할 때 더 큰 텐서에 맞게 자동으로 "확장(streched)"됩니다.
가장 간단하고 가장 일반적인 경우는 스칼라에 텐서를 곱하거나 추가하려고 할 때입니다. 이 경우, 스칼라는 다른 인수와 같은 형상으로 브로드캐스트됩니다.
마찬가지로, 크기가 1인 축은 다른 인수와 일치하도록 확장할 수 있습니다. 두 인수 모두 같은 계산으로 확장할 수 있습니다.
이 경우, 3x1 행렬에 요소별로 1x4 행렬을 곱하여 3x4 행렬을 만듭니다. 선행 1이 선택 사항인 점에 유의하세요. y의 형상은 [4]
입니다.
추가 시 브로드캐스팅: [1, 4] 와 [3, 1] 의 곱하기는 [3,4] 입니다. |
---|
![]() |
브로드캐스팅이 없는 같은 연산이 여기 있습니다.
대부분의 경우 브로드캐스팅은 브로드캐스트 연산으로 메모리에 확장된 텐서를 구체화하지 않으므로 시간과 공간 효율적입니다.
tf.broadcast_to
를 사용하여 브로드캐스팅이 어떤 모습인지 알 수 있습니다.
예를 들어, broadcast_to
는 수학적인 op와 달리 메모리를 절약하기 위해 특별한 연산을 수행하지 않습니다. 여기에서 텐서를 구체화합니다.
훨씬 더 복잡해질 수 있습니다. Jake VanderPlas의 저서 Python Data Science Handbook의 해당 섹션{:.external}에 더 많은 브로드캐스팅 트릭이 소개되어 있습니다(이번에도 NumPy에서).
tf.convert_to_tensor
tf.matmul
및 tf.reshape
와 같은 대부분의 ops는 클래스 tf.Tensor
의 인수를 사용합니다. 그러나 위의 경우, 텐서 형상의 Python 객체가 수용됨을 알 수 있습니다.
전부는 아니지만 대부분의 ops는 텐서가 아닌 인수에 대해 convert_to_tensor
를 호출합니다. 변환 레지스트리가 있어 NumPy의 ndarray
, TensorShape
, Python 목록 및 tf.Variable
과 같은 대부분의 객체 클래스는 모두 자동으로 변환됩니다.
자세한 내용은 tf.register_tensor_conversion_function
을 참조하세요. 자신만의 유형이 있으면 자동으로 텐서로 변환할 수 있습니다.
비정형 텐서
어떤 축을 따라 다양한 수의 요소를 가진 텐서를 "비정형(ragged)"이라고 합니다. 비정형 데이터에는 tf.ragged.RaggedTensor
를 사용합니다.
예를 들어, 비정형 텐서는 정규 텐서로 표현할 수 없습니다.
`tf.RaggedTensor`, 형상: [4, None] |
---|
![]() |
대신 tf.ragged.constant
를 사용하여 tf.RaggedTensor
를 작성합니다.
tf.RaggedTensor
의 형상에는 알 수 없는 길이의 일부 축이 포함됩니다.
문자열 텐서
tf.string
은 dtype
이며, 텐서에서 문자열(가변 길이의 바이트 배열)과 같은 데이터를 나타낼 수 있습니다.
문자열은 원자성이므로 Python 문자열과 같은 방식으로 인덱싱할 수 없습니다. 문자열의 길이는 텐서의 축 중의 하나가 아닙니다. 문자열을 조작하는 함수에 대해서는 tf.strings
를 참조하세요.
다음은 스칼라 문자열 텐서입니다.
문자열의 벡터는 다음과 같습니다.
문자열의 벡터, 형상: [3,] |
---|
![]() |
위의 출력에서 b
접두사는 tf.string
dtype이 유니코드 문자열이 아니라 바이트 문자열임을 나타냅니다. TensorFlow에서 유니코드 텍스트를 처리하는 자세한 내용은 유니코드 튜토리얼을 참조하세요.
유니코드 문자를 전달하면 UTF-8로 인코딩됩니다.
문자열이 있는 일부 기본 함수는 tf.strings
을 포함하여 tf.strings.split
에서 찾을 수 있습니다.
세 개의 분할된 문자열, 형상: [3, None] |
---|
![]() |
tf.strings.to_number
:
tf.cast
를 사용하여 문자열 텐서를 숫자로 변환할 수는 없지만, 바이트로 변환한 다음 숫자로 변환할 수 있습니다.
tf.string
dtype은 TensorFlow의 모든 원시 바이트 데이터에 사용됩니다. tf.io
모듈에는 이미지 디코딩 및 csv 구문 분석을 포함하여 데이터를 바이트로 변환하거나 바이트에서 변환하는 함수가 포함되어 있습니다.
희소 텐서
때로는 매우 넓은 임베드 공간과 같이 데이터가 희소합니다. TensorFlow는 tf.sparse.SparseTensor
및 관련 연산을 지원하여 희소 데이터를 효율적으로 저장합니다.
`tf.SparseTensor`, 형상: [3, 4] |
---|
![]() |