Branch data Line data Source code
1 : : /* SPDX-License-Identifier: BSD-3-Clause
2 : : * Copyright(c) 2010-2020 Intel Corporation
3 : : */
4 : :
5 : : #ifndef _VIRTIO_RXTX_PACKED_H_
6 : : #define _VIRTIO_RXTX_PACKED_H_
7 : :
8 : : #include <stdint.h>
9 : : #include <stdio.h>
10 : : #include <stdlib.h>
11 : : #include <string.h>
12 : : #include <errno.h>
13 : :
14 : : #include <rte_net.h>
15 : :
16 : : #include "virtio_logs.h"
17 : : #include "virtio_ethdev.h"
18 : : #include "virtio.h"
19 : : #include "virtqueue.h"
20 : :
21 : : #define BYTE_SIZE 8
22 : :
23 : : #ifdef CC_AVX512_SUPPORT
24 : : /* flag bits offset in packed ring desc higher 64bits */
25 : : #define FLAGS_BITS_OFFSET ((offsetof(struct vring_packed_desc, flags) - \
26 : : offsetof(struct vring_packed_desc, len)) * BYTE_SIZE)
27 : : #elif defined(RTE_ARCH_ARM)
28 : : /* flag bits offset in packed ring desc from ID */
29 : : #define FLAGS_BITS_OFFSET ((offsetof(struct vring_packed_desc, flags) - \
30 : : offsetof(struct vring_packed_desc, id)) * BYTE_SIZE)
31 : : #define FLAGS_LEN_BITS_OFFSET ((offsetof(struct vring_packed_desc, flags) - \
32 : : offsetof(struct vring_packed_desc, len)) * BYTE_SIZE)
33 : : #endif
34 : :
35 : : #define PACKED_FLAGS_MASK ((0ULL | VRING_PACKED_DESC_F_AVAIL_USED) << \
36 : : FLAGS_BITS_OFFSET)
37 : :
38 : : /* reference count offset in mbuf rearm data */
39 : : #define REFCNT_BITS_OFFSET ((offsetof(struct rte_mbuf, refcnt) - \
40 : : offsetof(struct rte_mbuf, rearm_data)) * BYTE_SIZE)
41 : :
42 : : #ifdef CC_AVX512_SUPPORT
43 : : /* segment number offset in mbuf rearm data */
44 : : #define SEG_NUM_BITS_OFFSET ((offsetof(struct rte_mbuf, nb_segs) - \
45 : : offsetof(struct rte_mbuf, rearm_data)) * BYTE_SIZE)
46 : : /* default rearm data */
47 : : #define DEFAULT_REARM_DATA (1ULL << SEG_NUM_BITS_OFFSET | \
48 : : 1ULL << REFCNT_BITS_OFFSET)
49 : : #endif
50 : :
51 : : /* id bits offset in packed ring desc higher 64bits */
52 : : #define ID_BITS_OFFSET ((offsetof(struct vring_packed_desc, id) - \
53 : : offsetof(struct vring_packed_desc, len)) * BYTE_SIZE)
54 : :
55 : : /* net hdr short size mask */
56 : : #define NET_HDR_MASK 0x3F
57 : :
58 : : #ifdef RTE_ARCH_ARM
59 : : /* The cache line size on different Arm platforms are different, so
60 : : * put a four batch size here to match with the minimum cache line
61 : : * size and accommodate NEON register size.
62 : : */
63 : : #define PACKED_BATCH_SIZE 4
64 : : #else
65 : : #define PACKED_BATCH_SIZE (RTE_CACHE_LINE_SIZE / \
66 : : sizeof(struct vring_packed_desc))
67 : : #endif
68 : : #define PACKED_BATCH_MASK (PACKED_BATCH_SIZE - 1)
69 : :
70 : : #if defined __clang__
71 : : #define virtio_for_each_try_unroll(iter, val, size) _Pragma("unroll 4") \
72 : : for (iter = val; iter < size; iter++)
73 : : #elif defined __GNUC__
74 : : #define virtio_for_each_try_unroll(iter, val, size) _Pragma("GCC unroll 4") \
75 : : for (iter = val; iter < size; iter++)
76 : : #else
77 : : #define virtio_for_each_try_unroll(iter, val, num) \
78 : : for (iter = val; iter < num; iter++)
79 : : #endif
80 : :
81 : : static inline void
82 : : virtio_update_batch_stats(struct virtnet_stats *stats,
83 : : uint16_t pkt_len1,
84 : : uint16_t pkt_len2,
85 : : uint16_t pkt_len3,
86 : : uint16_t pkt_len4)
87 : : {
88 : 0 : stats->bytes += pkt_len1;
89 : 0 : stats->bytes += pkt_len2;
90 : 0 : stats->bytes += pkt_len3;
91 [ # # # # ]: 0 : stats->bytes += pkt_len4;
92 : : }
93 : :
94 : : static inline int
95 : 0 : virtqueue_enqueue_single_packed_vec(struct virtnet_tx *txvq,
96 : : struct rte_mbuf *txm)
97 : : {
98 : 0 : struct virtqueue *vq = virtnet_txq_to_vq(txvq);
99 : 0 : struct virtio_hw *hw = vq->hw;
100 [ # # ]: 0 : uint16_t hdr_size = hw->vtnet_hdr_size;
101 : : uint16_t slots, can_push = 0, use_indirect = 0;
102 : : int16_t need;
103 : :
104 : : /* optimize ring usage */
105 [ # # # # ]: 0 : if ((virtio_with_feature(hw, VIRTIO_F_ANY_LAYOUT) ||
106 [ # # ]: 0 : virtio_with_feature(hw, VIRTIO_F_VERSION_1)) &&
107 [ # # ]: 0 : rte_mbuf_refcnt_read(txm) == 1 && RTE_MBUF_DIRECT(txm) &&
108 [ # # # # ]: 0 : txm->nb_segs == 1 && rte_pktmbuf_headroom(txm) >= hdr_size)
109 : : can_push = 1;
110 [ # # ]: 0 : else if (virtio_with_feature(hw, VIRTIO_RING_F_INDIRECT_DESC) &&
111 [ # # ]: 0 : txm->nb_segs < VIRTIO_MAX_TX_INDIRECT)
112 : : use_indirect = 1;
113 : :
114 : : /* How many main ring entries are needed to this Tx?
115 : : * indirect => 1
116 : : * any_layout => number of segments
117 : : * default => number of segments + 1
118 : : */
119 : 0 : can_push = rte_mbuf_refcnt_read(txm) == 1 &&
120 [ # # ]: 0 : RTE_MBUF_DIRECT(txm) &&
121 [ # # # # : 0 : txm->nb_segs == 1 &&
# # ]
122 : : rte_pktmbuf_headroom(txm) >= hdr_size;
123 : :
124 [ # # ]: 0 : slots = use_indirect ? 1 : (txm->nb_segs + !can_push);
125 : 0 : need = slots - vq->vq_free_cnt;
126 : :
127 : : /* Positive value indicates it need free vring descriptors */
128 [ # # ]: 0 : if (unlikely(need > 0)) {
129 : 0 : virtio_xmit_cleanup_inorder_packed(vq, need);
130 : 0 : need = slots - vq->vq_free_cnt;
131 [ # # ]: 0 : if (unlikely(need > 0)) {
132 : : PMD_TX_LOG(ERR,
133 : : "No free tx descriptors to transmit");
134 : : return -1;
135 : : }
136 : : }
137 : :
138 : : /* Enqueue Packet buffers */
139 : 0 : virtqueue_enqueue_xmit_packed(txvq, txm, slots, use_indirect,
140 : : can_push, 1);
141 : :
142 : 0 : txvq->stats.bytes += txm->pkt_len;
143 : 0 : return 0;
144 : : }
145 : :
146 : : /* Optionally fill offload information in structure */
147 : : static inline int
148 : 0 : virtio_vec_rx_offload(struct rte_mbuf *m, struct virtio_net_hdr *hdr)
149 : : {
150 : : struct rte_net_hdr_lens hdr_lens;
151 : : uint32_t hdrlen, ptype;
152 : : int l4_supported = 0;
153 : :
154 : : /* nothing to do */
155 [ # # ]: 0 : if (hdr->flags == 0)
156 : : return 0;
157 : :
158 : : /* GSO not support in vec path, skip check */
159 : : m->ol_flags |= RTE_MBUF_F_RX_IP_CKSUM_UNKNOWN;
160 : :
161 : 0 : ptype = rte_net_get_ptype(m, &hdr_lens, RTE_PTYPE_ALL_MASK);
162 : 0 : m->packet_type = ptype;
163 [ # # ]: 0 : if ((ptype & RTE_PTYPE_L4_MASK) == RTE_PTYPE_L4_TCP ||
164 [ # # ]: 0 : (ptype & RTE_PTYPE_L4_MASK) == RTE_PTYPE_L4_UDP ||
165 : : (ptype & RTE_PTYPE_L4_MASK) == RTE_PTYPE_L4_SCTP)
166 : : l4_supported = 1;
167 : :
168 [ # # ]: 0 : if (hdr->flags & VIRTIO_NET_HDR_F_NEEDS_CSUM) {
169 : 0 : hdrlen = hdr_lens.l2_len + hdr_lens.l3_len + hdr_lens.l4_len;
170 [ # # # # ]: 0 : if (hdr->csum_start <= hdrlen && l4_supported) {
171 : 0 : m->ol_flags |= RTE_MBUF_F_RX_L4_CKSUM_NONE;
172 : : } else {
173 : : /* Unknown proto or tunnel, do sw cksum. We can assume
174 : : * the cksum field is in the first segment since the
175 : : * buffers we provided to the host are large enough.
176 : : * In case of SCTP, this will be wrong since it's a CRC
177 : : * but there's nothing we can do.
178 : : */
179 : 0 : uint16_t csum = 0, off;
180 : :
181 [ # # ]: 0 : if (rte_raw_cksum_mbuf(m, hdr->csum_start,
182 : 0 : rte_pktmbuf_pkt_len(m) - hdr->csum_start,
183 : : &csum) < 0)
184 : 0 : return -1;
185 [ # # ]: 0 : if (likely(csum != 0xffff))
186 : 0 : csum = ~csum;
187 : 0 : off = hdr->csum_offset + hdr->csum_start;
188 [ # # ]: 0 : if (rte_pktmbuf_data_len(m) >= off + 1)
189 : 0 : *rte_pktmbuf_mtod_offset(m, uint16_t *,
190 : 0 : off) = csum;
191 : : }
192 [ # # # # ]: 0 : } else if (hdr->flags & VIRTIO_NET_HDR_F_DATA_VALID && l4_supported) {
193 : 0 : m->ol_flags |= RTE_MBUF_F_RX_L4_CKSUM_GOOD;
194 : : }
195 : :
196 : : return 0;
197 : : }
198 : :
199 : : static inline uint16_t
200 : 0 : virtqueue_dequeue_single_packed_vec(struct virtnet_rx *rxvq,
201 : : struct rte_mbuf **rx_pkts)
202 : : {
203 : : uint16_t used_idx, id;
204 : : uint32_t len;
205 : 0 : struct virtqueue *vq = virtnet_rxq_to_vq(rxvq);
206 : 0 : struct virtio_hw *hw = vq->hw;
207 : 0 : uint32_t hdr_size = hw->vtnet_hdr_size;
208 : : struct virtio_net_hdr *hdr;
209 : : struct vring_packed_desc *desc;
210 : : struct rte_mbuf *cookie;
211 : :
212 : 0 : desc = vq->vq_packed.ring.desc;
213 : 0 : used_idx = vq->vq_used_cons_idx;
214 [ # # ]: 0 : if (!desc_is_used(&desc[used_idx], vq))
215 : : return -1;
216 : :
217 : 0 : len = desc[used_idx].len;
218 : 0 : id = desc[used_idx].id;
219 : 0 : cookie = (struct rte_mbuf *)vq->vq_descx[id].cookie;
220 [ # # ]: 0 : if (unlikely(cookie == NULL)) {
221 : 0 : PMD_DRV_LOG(ERR, "vring descriptor with no mbuf cookie at %u",
222 : : vq->vq_used_cons_idx);
223 : 0 : return -1;
224 : : }
225 : : rte_prefetch0(cookie);
226 : 0 : rte_packet_prefetch(rte_pktmbuf_mtod(cookie, void *));
227 : :
228 : 0 : cookie->data_off = RTE_PKTMBUF_HEADROOM;
229 : 0 : cookie->ol_flags = 0;
230 : 0 : cookie->pkt_len = (uint32_t)(len - hdr_size);
231 : 0 : cookie->data_len = (uint32_t)(len - hdr_size);
232 : :
233 : 0 : hdr = (struct virtio_net_hdr *)((char *)cookie->buf_addr +
234 : 0 : RTE_PKTMBUF_HEADROOM - hdr_size);
235 [ # # ]: 0 : if (hw->has_rx_offload)
236 : 0 : virtio_vec_rx_offload(cookie, hdr);
237 : :
238 : 0 : *rx_pkts = cookie;
239 : :
240 : 0 : rxvq->stats.bytes += cookie->pkt_len;
241 : :
242 : 0 : vq->vq_free_cnt++;
243 : 0 : vq->vq_used_cons_idx++;
244 [ # # ]: 0 : if (vq->vq_used_cons_idx >= vq->vq_nentries) {
245 : 0 : vq->vq_used_cons_idx -= vq->vq_nentries;
246 : 0 : vq->vq_packed.used_wrap_counter ^= 1;
247 : : }
248 : :
249 : : return 0;
250 : : }
251 : :
252 : : static inline void
253 : 0 : virtio_recv_refill_packed_vec(struct virtnet_rx *rxvq,
254 : : struct rte_mbuf **cookie,
255 : : uint16_t num)
256 : : {
257 : 0 : struct virtqueue *vq = virtnet_rxq_to_vq(rxvq);
258 : 0 : struct vring_packed_desc *start_dp = vq->vq_packed.ring.desc;
259 : 0 : uint16_t flags = vq->vq_packed.cached_flags;
260 : 0 : struct virtio_hw *hw = vq->hw;
261 : : struct vq_desc_extra *dxp;
262 : : uint16_t idx, i;
263 : : uint16_t batch_num, total_num = 0;
264 : 0 : uint16_t head_idx = vq->vq_avail_idx;
265 : : uint16_t head_flag = vq->vq_packed.cached_flags;
266 : : uint64_t addr;
267 : :
268 : : do {
269 : 0 : idx = vq->vq_avail_idx;
270 : :
271 : : batch_num = PACKED_BATCH_SIZE;
272 [ # # ]: 0 : if (unlikely((idx + PACKED_BATCH_SIZE) > vq->vq_nentries))
273 : 0 : batch_num = vq->vq_nentries - idx;
274 [ # # ]: 0 : if (unlikely((total_num + batch_num) > num))
275 : 0 : batch_num = num - total_num;
276 : :
277 [ # # ]: 0 : virtio_for_each_try_unroll(i, 0, batch_num) {
278 : 0 : dxp = &vq->vq_descx[idx + i];
279 : 0 : dxp->cookie = (void *)cookie[total_num + i];
280 : :
281 : 0 : addr = VIRTIO_MBUF_ADDR(cookie[total_num + i], vq) +
282 : 0 : RTE_PKTMBUF_HEADROOM - hw->vtnet_hdr_size;
283 : 0 : start_dp[idx + i].addr = addr;
284 : 0 : start_dp[idx + i].len = cookie[total_num + i]->buf_len
285 : 0 : - RTE_PKTMBUF_HEADROOM + hw->vtnet_hdr_size;
286 [ # # ]: 0 : if (total_num || i) {
287 : : virtqueue_store_flags_packed(&start_dp[idx + i],
288 [ # # ]: 0 : flags, hw->weak_barriers);
289 : : }
290 : : }
291 : :
292 : 0 : vq->vq_avail_idx += batch_num;
293 [ # # ]: 0 : if (vq->vq_avail_idx >= vq->vq_nentries) {
294 : 0 : vq->vq_avail_idx -= vq->vq_nentries;
295 : 0 : vq->vq_packed.cached_flags ^=
296 : : VRING_PACKED_DESC_F_AVAIL_USED;
297 : : flags = vq->vq_packed.cached_flags;
298 : : }
299 : 0 : total_num += batch_num;
300 [ # # ]: 0 : } while (total_num < num);
301 : :
302 : 0 : virtqueue_store_flags_packed(&start_dp[head_idx], head_flag,
303 [ # # ]: 0 : hw->weak_barriers);
304 : 0 : vq->vq_free_cnt = (uint16_t)(vq->vq_free_cnt - num);
305 : 0 : }
306 : :
307 : : #endif /* _VIRTIO_RXTX_PACKED_H_ */
|